Панды читают csv, одновременно передавая аргументы usecols и name

Панды читают csv, одновременно передавая аргументы usecols и name ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Панды читают csv, одновременно передавая аргументы usecols и name

Цитата

Сообщение Anonymous » 28 июн 2024, 12:55

При чтении файла CSV как кадра данных pandas возникает ошибка при попытке выбрать подмножество столбцов на основе исходных имен столбцов (

Код: Выделить всё

usecols=

) и переименование выбранных столбцов (

Код: Выделить всё

names=). Передача переименованных имен столбцов в usecols

работает, но для правильного выбора столбцов необходимо передать все столбцы в имена.

Код: Выделить всё

# read the entire CSV
df1a = pd.read_csv(folder_csv+'test_read_csv.csv')
# select a subset of columns while reading the CSV
df1b = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['Col1','Col3'])
# rename columns while reading the CSV
df1c = pd.read_csv(folder_csv+'test_read_csv.csv', names=['first', 'second', 'third'], header=0)

# select a subset of columns and rename them while reading the CSV;
# throws error "ValueError: Usecols do not match columns, columns expected but not found: ['Col3', 'Col1']"
df1d = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['Col1','Col3'], names=['first','third'])

# selects columns 1 and 2, calling them 1 and 3
df1e = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['first','third'], names=['first','third'])
# selects columns 1 and 3 correctly
df1f = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['first','third'], names=['first','second','third'])

Файл CSV test read_csv.csv:

Код: Выделить всё

Col1,Col2,Col3
val1a,val2a,val3a
val1b,val2b,val3b
val1c,val2c,val3c
val1d,val2d,val3d
val1e,val2e,val3e

Разве не было бы довольно распространенным вариантом использования определенных столбцов на основе исходных имен столбцов, а затем переименовывать только эти столбцы во время чтения данные?
Конечно, можно выбрать столбцы и переименовать их после загрузки всего CSV-файла:

Код: Выделить всё

df1 = df1[['Col1','Col3']]
df1.columns = ['first', 'third']

Но я не знаю, как и можно ли это интегрировать напрямую при чтении данных. То же самое справедливо и для pd.read_excel().

Подробнее здесь: https://stackoverflow.com/questions/786 ... names-args

1719568548

Anonymous

При чтении файла CSV как кадра данных pandas возникает ошибка при попытке выбрать подмножество столбцов на основе исходных имен столбцов ([code]usecols=[/code]) и переименование выбранных столбцов ([code]names=). Передача переименованных имен столбцов в usecols[/code] работает, но для правильного выбора столбцов необходимо передать все столбцы в имена.
[code]# read the entire CSV
df1a = pd.read_csv(folder_csv+'test_read_csv.csv')
# select a subset of columns while reading the CSV
df1b = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['Col1','Col3'])
# rename columns while reading the CSV
df1c = pd.read_csv(folder_csv+'test_read_csv.csv', names=['first', 'second', 'third'], header=0)

# select a subset of columns and rename them while reading the CSV;
# throws error "ValueError: Usecols do not match columns, columns expected but not found: ['Col3', 'Col1']"
df1d = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['Col1','Col3'], names=['first','third'])

# selects columns 1 and 2, calling them 1 and 3
df1e = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['first','third'], names=['first','third'])
# selects columns 1 and 3 correctly
df1f = pd.read_csv(folder_csv+'test_read_csv.csv', usecols=['first','third'], names=['first','second','third'])
[/code]
Файл CSV test read_csv.csv:
[code]Col1,Col2,Col3
val1a,val2a,val3a
val1b,val2b,val3b
val1c,val2c,val3c
val1d,val2d,val3d
val1e,val2e,val3e
[/code]
[b]Разве не было бы довольно распространенным вариантом использования определенных столбцов на основе исходных имен столбцов, а затем переименовывать только эти столбцы во время чтения данные?[/b]
Конечно, можно выбрать столбцы и переименовать их после загрузки всего CSV-файла:
[code]df1 = df1[['Col1','Col3']]
df1.columns = ['first', 'third']
[/code]
Но я не знаю, как и можно ли это интегрировать напрямую при чтении данных. То же самое справедливо и для pd.read_excel(). 

Подробнее здесь: [url]https://stackoverflow.com/questions/78681656/pandas-read-csv-simultaneously-passing-usecols-and-names-args[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Панды читают CSV с разделителями табуляции

Последнее сообщение Anonymous « 07 май 2024, 10:34
Добавлено в форуме Python

Anonymous » 07 май 2024, 10:34 » в форуме Python

У меня возникла проблема с построением профилей нагрузки для бакалаврской диссертации.
У меня есть файл csv, разделенный вкладками, например: PV-Energie (AC) abzgl. Standby-Verbrauch,
-0,01747
-0,01747
-0,01747
-0,01747
-0,01747
-0,01747
-0,01747...

0 Ответы

55 Просмотры

Последнее сообщение Anonymous
07 май 2024, 10:34
Панды читают CSV, содержащий несколько таблиц

Последнее сообщение Anonymous « 30 июл 2024, 02:20
Добавлено в форуме Python

Anonymous » 30 июл 2024, 02:20 » в форуме Python

У меня есть URL-адрес, по которому загружается файл csv. Чтобы открыть его, я использую следующий код:
df = pd.read_csv(url)

большинство URL-адресов, которые я использую, содержат только одну таблицу и открываются нормально, но некоторые имеют...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 02:20
Панды читают CSV как тип строки

Последнее сообщение Anonymous « 06 май 2025, 16:58
Добавлено в форуме Python

Anonymous » 06 май 2025, 16:58 » в форуме Python

У меня есть кадр данных с альфа-нучевыми ключами, которые я хочу сохранить в качестве CSV, и прочитать позже. По разным причинам мне нужно явно прочитать этот столбец ключа как формат строки, у меня есть ключи, которые являются строго числовыми или...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
06 май 2025, 16:58
Панды читают в CSV с использованием одной цитаты в качестве Quotechar Throws SyntaxError: неполный ввод

Последнее сообщение Anonymous « 13 июн 2025, 12:08
Добавлено в форуме Python

Anonymous » 13 июн 2025, 12:08 » в форуме Python

Я в настоящее время пытаюсь прочитать в .csv со следующей структурой:
samplecsv = 'column A', 'column b', 'column c',
'valueA', 'valueb', 'valuec,d',
'valueA', 'valueb', 'valuecd',
'valueA', 'valueb', 'valuecd',
'valueA', 'valueb', 'valuec,d'...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
13 июн 2025, 12:08
Панды читают XML-файл с назначенным типом данных

Последнее сообщение Anonymous « 11 июл 2024, 18:54
Добавлено в форуме Python

Anonymous » 11 июл 2024, 18:54 » в форуме Python

Мой код:
df = pd.read_xml(
path_or_buffer=PATH,
xpath= //Data ,
compression= gzip
)

Я использую функцию Pandas read_xml() для чтения данных формата xml.gz. Я использую версию Pandas 1.3.2. Когда я попытался прочитать данные, Pandas прочитал их...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
11 июл 2024, 18:54

Вернуться в «Python»