Разделить/разбить столбец словарей на отдельные столбцы с помощью панд

Разделить/разбить столбец словарей на отдельные столбцы с помощью панд ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Разделить/разбить столбец словарей на отдельные столбцы с помощью панд

Быстрая цитата

Сообщение Anonymous » 01 июн 2024, 21:07

У меня есть данные, сохраненные в базе данных postgreSQL. Я запрашиваю эти данные с помощью Python2.7 и превращаю их в DataFrame Pandas. Однако последний столбец этого фрейма данных содержит внутри себя словарь значений. DataFrame df выглядит следующим образом:

Код: Выделить всё

Station ID     Pollutants
8809           {"a": "46", "b": "3", "c": "12"}
8810           {"a": "36", "b": "5", "c": "8"}
8811           {"b": "2", "c": "7"}
8812           {"c": "11"}
8813           {"a": "82", "c": "15"}

Мне нужно разделить этот столбец на отдельные столбцы, чтобы DataFrame `df2 выглядел следующим образом:

Код: Выделить всё

Station ID     a      b       c
8809           46     3       12
8810           36     5       8
8811           NaN    2       7
8812           NaN    NaN     11
8813           82     NaN     15

Основная проблема, с которой я столкнулся, заключается в том, что списки имеют разную длину. Но все списки содержат не более трех одинаковых значений: «a», «b» и «c». И они всегда появляются в одном и том же порядке (сначала «a», второй «b», третий «c»).
Следующий код ИСПОЛЬЗУЕТСЯ для работы и возврата именно того, что я хотел (df2 ).

Код: Выделить всё

objs = [df, pandas.DataFrame(df['Pollutant Levels'].tolist()).iloc[:, :3]]
df2 = pandas.concat(objs, axis=1).drop('Pollutant Levels', axis=1)
print(df2)

Я запускал этот код только на прошлой неделе, и он работал нормально. Но теперь мой код не работает, и я получаю эту ошибку в строке [4]:

Код: Выделить всё

IndexError: out-of-bounds on slice (end)

Я не вносил никаких изменений в код, но теперь получаю сообщение об ошибке. Я считаю, что это связано с тем, что мой метод не является надежным и правильным.
Любые предложения или рекомендации о том, как разделить этот столбец списков на отдельные столбцы, будут очень признательны!РЕДАКТИРОВАТЬ: Я думаю, что методы .tolist() и .apply не работают с моим кодом, потому что это одна строка Unicode, т.е.:

Код: Выделить всё

#My data format
u{'a': '1', 'b': '2', 'c': '3'}

#and not
{u'a': '1', u'b': '2', u'c': '3'}

Данные импортируются из базы данных postgreSQL в этом формате. Любая помощь или идеи по этому вопросу? есть ли способ конвертировать Юникод?

Подробнее здесь: https://stackoverflow.com/questions/382 ... ith-pandas

1717265277

Anonymous

У меня есть данные, сохраненные в базе данных postgreSQL. Я запрашиваю эти данные с помощью Python2.7 и превращаю их в DataFrame Pandas. Однако последний столбец этого фрейма данных содержит внутри себя словарь значений. DataFrame df выглядит следующим образом:
[code]Station ID     Pollutants
8809           {"a": "46", "b": "3", "c": "12"}
8810           {"a": "36", "b": "5", "c": "8"}
8811           {"b": "2", "c": "7"}
8812           {"c": "11"}
8813           {"a": "82", "c": "15"}
[/code]
Мне нужно разделить этот столбец на отдельные столбцы, чтобы DataFrame `df2 выглядел следующим образом:
[code]Station ID     a      b       c
8809           46     3       12
8810           36     5       8
8811           NaN    2       7
8812           NaN    NaN     11
8813           82     NaN     15
[/code]
Основная проблема, с которой я столкнулся, заключается в том, что списки имеют разную длину. Но [b]все списки содержат не более трех одинаковых значений: «a», «b» и «c»[/b]. И они всегда появляются в одном и том же порядке (сначала «a», второй «b», третий «c»).
Следующий код ИСПОЛЬЗУЕТСЯ для работы и возврата именно того, что я хотел (df2 ).
[code]objs = [df, pandas.DataFrame(df['Pollutant Levels'].tolist()).iloc[:, :3]]
df2 = pandas.concat(objs, axis=1).drop('Pollutant Levels', axis=1)
print(df2)
[/code]
Я запускал этот код только на прошлой неделе, и он работал нормально. Но теперь мой код не работает, и я получаю эту ошибку в строке [4]:
[code]IndexError: out-of-bounds on slice (end)
[/code]
Я не вносил никаких изменений в код, но теперь получаю сообщение об ошибке. Я считаю, что это связано с тем, что мой метод не является надежным и правильным.
Любые предложения или рекомендации о том, как разделить этот столбец списков на отдельные столбцы, будут очень признательны!РЕДАКТИРОВАТЬ: Я думаю, что методы .tolist() и .apply не работают с моим кодом, потому что это одна строка Unicode, т.е.:
[code]#My data format
u{'a': '1', 'b': '2', 'c': '3'}

#and not
{u'a': '1', u'b': '2', u'c': '3'}
[/code]
Данные импортируются из базы данных postgreSQL в этом формате. Любая помощь или идеи по этому вопросу? есть ли способ конвертировать Юникод? 

Подробнее здесь: [url]https://stackoverflow.com/questions/38231591/split-explode-a-column-of-dictionaries-into-separate-columns-with-pandas[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как разбить столбец списка и пропорционально разделить целочисленный столбец в полях Python?

Последнее сообщение Гость « 11 мар 2024, 14:33
Добавлено в форуме Python

Гость » 11 мар 2024, 14:33 » в форуме Python

У меня есть набор данных, который включает типы элементов и количество каждого элемента, за исключением того, что некоторые строки столбца типа элемента содержат списки типов вместо одного типа. Я хочу разбить список типов на отдельные строки и...

0 Ответы

45 Просмотры

Последнее сообщение Гость
11 мар 2024, 14:33
Выберите столбцы с повторяющимися именами панд, например «столбец 'a' плюс любой столбец, имя которого встречается более

Последнее сообщение Anonymous « 07 дек 2023, 19:54
Добавлено в форуме Python

Anonymous » 07 дек 2023, 19:54 » в форуме Python

Я хочу выбрать определенные столбцы, даже если они дублируются, сохраняя при этом те же имена

col_select = а х х х г 0 6 2 7 7 8 1 6 6 3 1 1 2 6 6 7 5 6 3 8 3 6 1 8 4 5 7 5 3 0 желаемый результат
а х х х 0 6 2 7 5 1 6 6 3 1 2 6 6 7 5 3 8 3 6 1 4...

0 Ответы

58 Просмотры

Последнее сообщение Anonymous
07 дек 2023, 19:54
Разделите столбцы списков из CSV на отдельные файлы CSV с помощью панд.

Последнее сообщение Anonymous « 19 ноя 2024, 02:07
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 02:07 » в форуме Python

У меня есть файлы CSV, содержащие несколько столбцов данных, полученных из API, которые могут быть либо значением, либо списком/массивом. Размер этих списков одинаков для каждого столбца (например, столбец с именем ALPHANUMS, имеющий строку,...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 02:07
Разделите столбцы списков из CSV на отдельные файлы CSV с помощью панд.

Последнее сообщение Anonymous « 19 ноя 2024, 05:00
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 05:00 » в форуме Python

У меня есть файлы CSV, содержащие несколько столбцов данных, полученных из API, которые могут быть либо значением, либо списком/массивом. Размер этих списков одинаков для каждого столбца (например, столбец с именем ALPHANUMS, имеющий строку,...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 05:00
Разделите столбцы списков из CSV на отдельные файлы CSV с помощью панд.

Последнее сообщение Anonymous « 19 ноя 2024, 07:44
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 07:44 » в форуме Python

У меня есть файлы CSV, содержащие несколько столбцов данных, полученных из API, которые могут быть либо значением, либо списком/массивом. Размер этих списков одинаков для каждого столбца (например, столбец с именем ALPHANUMS, имеющий строку,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 07:44

Вернуться в «Python»