«Предупреждение о производительности: Dataframe сильно фрагментирован» при добавлении столбца в панды [закрыто]

«Предупреждение о производительности: Dataframe сильно фрагментирован» при добавлении столбца в панды [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

«Предупреждение о производительности: Dataframe сильно фрагментирован» при добавлении столбца в панды [закрыто]

Быстрая цитата

Сообщение Anonymous » 18 май 2024, 19:41

При выполнении моего кода появляется это предупреждение.

PerformanceWarning: DataFrame сильно фрагментирован. Обычно это является результатом многократного вызова Frame.insert, что приводит к низкой производительности. Рассмотрите возможность объединения всех столбцов одновременно, используя вместо этого pd.concat(axis=1). Чтобы получить дефрагментированный кадр, используйте newframe =frame.copy()

Я работаю с кадром данных с большим количеством столбцов (это исходные данные, эти столбцы я не добавлял), и это первый столбец, который я добавляю.

Код: Выделить всё

df["mapped_column"] = df["column_to_map"].map(map_dict)

Это строка, которая выдает мне предупреждение, и она не находится внутри цикла или чего-то подобного, она вызывается только один раз. Map_dict — это словарь, содержащий все значения столбца_to_map.
Я прочитал этот вопрос и попробовал предложения, но ничего не помогло (за исключением, конечно, игнорирования предупреждения) .
У меня два вопроса: что такое фрагментированный DataFrame?
Что я делаю неправильно?
Изменить (подробнее)
Источником моего df является файл csv на моем компьютере, который я загружаю с помощью pd.read_csv(). Он имеет 203 столбца и 12 строк (он довольно маленький). При чтении файла все столбцы читаются как строки, за исключением трех, которые являются числами с плавающей запятой. Прежде чем выполнить операцию, которая вызывает предупреждение в моем df, я выполняю две операции:

Изменяю тип «column_to_map» с объекта на категорию.
Измените другой столбец с object на datetime64 с помощью pd.to_datetime().
Я не могу сделать код более воспроизводимо, поскольку я не могу вставить сюда исходные данные.

Подробнее здесь: https://stackoverflow.com/questions/784 ... -column-to

1716050470

Anonymous

При выполнении моего кода появляется это предупреждение.

PerformanceWarning: DataFrame сильно фрагментирован. Обычно это является результатом многократного вызова Frame.insert, что приводит к низкой производительности. Рассмотрите возможность объединения всех столбцов одновременно, используя вместо этого pd.concat(axis=1). Чтобы получить дефрагментированный кадр, используйте newframe =frame.copy()

Я работаю с кадром данных с большим количеством столбцов (это исходные данные, эти столбцы я не добавлял), и это первый столбец, который я добавляю.
[code]df["mapped_column"] = df["column_to_map"].map(map_dict)
[/code]
Это строка, которая выдает мне предупреждение, и она не находится внутри цикла или чего-то подобного, она вызывается только один раз. Map_dict — это словарь, содержащий все значения столбца_to_map.
Я прочитал этот вопрос и попробовал предложения, но ничего не помогло (за исключением, конечно, игнорирования предупреждения) .
У меня два вопроса: что такое фрагментированный DataFrame?
Что я делаю неправильно?
Изменить (подробнее) 
Источником моего df является файл csv на моем компьютере, который я загружаю с помощью pd.read_csv(). Он имеет 203 столбца и 12 строк (он довольно маленький). При чтении файла все столбцы читаются как строки, за исключением трех, которые являются числами с плавающей запятой. Прежде чем выполнить операцию, которая вызывает предупреждение в моем df, я выполняю две операции:
[list]
[*]Изменяю тип «column_to_map» с объекта на категорию.
[*]Измените другой столбец с object на datetime64 с помощью pd.to_datetime().
Я не могу сделать код более воспроизводимо, поскольку я не могу вставить сюда исходные данные.
[/list] 

Подробнее здесь: [url]https://stackoverflow.com/questions/78497435/performance-warning-data-frame-is-highly-fragmentated-when-adding-a-column-to[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Похожие темы

Ответы

Просмотры

Последнее сообщение

Предупреждение о производительности: DataFrame сильно фрагментирован. Обычно это результат многократного вызова `frame.i

Последнее сообщение Anonymous « 05 июл 2024, 13:51
Добавлено в форуме Python

Anonymous » 05 июл 2024, 13:51 » в форуме Python

Я получил следующее предупреждение

PerformanceWarning: DataFrame сильно фрагментирован. Обычно это
результат многократного вызова Frame.insert, что приводит к низкой
производительности. Вместо этого рассмотрите возможность использования pd.concat....

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
05 июл 2024, 13:51
Предупреждение о производительности: DataFrame сильно фрагментирован. Обычно это результат многократного вызова `frame.i

Последнее сообщение Anonymous « 17 сен 2024, 14:50
Добавлено в форуме Python

Anonymous » 17 сен 2024, 14:50 » в форуме Python

Я получил следующее предупреждение

PerformanceWarning: DataFrame сильно фрагментирован. Обычно это
результат многократного вызова Frame.insert, что приводит к низкой
производительности. Вместо этого рассмотрите возможность использования pd.concat....

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 14:50
Как эффективно расширить одноиндексный DataFrame до многоиндексного DataFrame? (питон, панды)

Последнее сообщение Anonymous « 19 сен 2024, 06:50
Добавлено в форуме Python

Anonymous » 19 сен 2024, 06:50 » в форуме Python

import pandas as pd
concordance_region = pd.DataFrame(
{
country 1 : pd.Series( , index= ),
country 2 : pd.Series( , index= ),
country 3 : pd.Series( , index= ),
}
)
display(concordance_region)
country_index = concordance_region.columns...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 06:50
Как эффективно расширить одноиндексный DataFrame до многоиндексного DataFrame? (питон, панды)

Последнее сообщение Anonymous « 19 сен 2024, 08:13
Добавлено в форуме Python

Anonymous » 19 сен 2024, 08:13 » в форуме Python

import pandas as pd
concordance_region = pd.DataFrame(
{
country 1 : pd.Series( , index= ),
country 2 : pd.Series( , index= ),
country 3 : pd.Series( , index= ),
}
)
display(concordance_region)
country_index = concordance_region.columns...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 08:13
Панды - более разумный способ разделить некоторые столбцы на DataFrame на другой DataFrame

Последнее сообщение Anonymous « 20 фев 2025, 20:25
Добавлено в форуме Python

Anonymous » 20 фев 2025, 20:25 » в форуме Python

У меня есть DataFrame df1 , который имеет годовой столбец и цифровые столбцы. Значения года в DF1 не являются уникальными. Я хотел бы нормализовать числовые столбцы df1 на годовом уровне, используя определенную функцию. Для этой цели у меня есть еще...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 20:25

Вернуться в «Python»