# read the entire CSV
df1a = pd.read_csv(folder_csv+'test_read_csv.csv')
# select a subset of columns while reading the CSV
df1b = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['Col1','Col3'])
# rename columns while reading the CSV
df1c = pd.read_csv(folder_csv+'test_read_csv.csv', names=['first', 'second', 'third'], header=0)
# select a subset of columns and rename them while reading the CSV;
# throws error "ValueError: Usecols do not match columns, columns expected but not found: ['Col3', 'Col1']"
df1d = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['Col1','Col3'], names=['first','third'])
# selects columns 1 and 2, calling them 1 and 3
df1e = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['first','third'], names=['first','third'])
# selects columns 1 and 3 correctly
df1f = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['first','third'], names=['first','second','third'])
Разве не было бы довольно распространенным вариантом использования определенных столбцов на основе исходных имен столбцов, а затем переименовывать только эти столбцы во время чтения данные?
Конечно, можно выбрать столбцы и переименовать их после загрузки всего CSV-файла:
При чтении файла CSV как кадра данных pandas возникает ошибка при попытке выбрать подмножество столбцов на основе исходных имен столбцов ([code]usecols=[/code]) и переименование выбранных столбцов ([code]names=). Передача переименованных имен столбцов в usecols[/code] работает, но для правильного выбора столбцов необходимо передать все столбцы в имена. [code]# read the entire CSV df1a = pd.read_csv(folder_csv+'test_read_csv.csv') # select a subset of columns while reading the CSV df1b = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['Col1','Col3']) # rename columns while reading the CSV df1c = pd.read_csv(folder_csv+'test_read_csv.csv', names=['first', 'second', 'third'], header=0)
# select a subset of columns and rename them while reading the CSV; # throws error "ValueError: Usecols do not match columns, columns expected but not found: ['Col3', 'Col1']" df1d = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['Col1','Col3'], names=['first','third'])
# selects columns 1 and 2, calling them 1 and 3 df1e = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['first','third'], names=['first','third']) # selects columns 1 and 3 correctly df1f = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['first','third'], names=['first','second','third']) [/code] Файл CSV test read_csv.csv: [code]Col1,Col2,Col3 val1a,val2a,val3a val1b,val2b,val3b val1c,val2c,val3c val1d,val2d,val3d val1e,val2e,val3e [/code] [b]Разве не было бы довольно распространенным вариантом использования определенных столбцов на основе исходных имен столбцов, а затем переименовывать только эти столбцы во время чтения данные?[/b] Конечно, можно выбрать столбцы и переименовать их после загрузки всего CSV-файла: [code]df1 = df1[['Col1','Col3']] df1.columns = ['first', 'third'] [/code] Но я не знаю, как и можно ли это интегрировать напрямую при чтении данных. То же самое справедливо и для pd.read_excel().
У меня возникла проблема с построением профилей нагрузки для бакалаврской диссертации.
У меня есть файл csv, разделенный вкладками, например: PV-Energie (AC) abzgl. Standby-Verbrauch,
-0,01747
-0,01747
-0,01747
-0,01747
-0,01747
-0,01747
-0,01747...
У меня есть кадр данных с альфа-нучевыми ключами, которые я хочу сохранить в качестве CSV, и прочитать позже. По разным причинам мне нужно явно прочитать этот столбец ключа как формат строки, у меня есть ключи, которые являются строго числовыми или...
Я использую функцию Pandas read_xml() для чтения данных формата xml.gz. Я использую версию Pandas 1.3.2. Когда я попытался прочитать данные, Pandas прочитал их...