[Python][Pandas] Фильтрация кадров данных на основе значения столбца

[Python][Pandas] Фильтрация кадров данных на основе значения столбца ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

[Python][Pandas] Фильтрация кадров данных на основе значения столбца

Цитата

Сообщение Anonymous » 09 апр 2024, 13:34

У меня есть Excel, который мне затем нужно преобразовать в фрейм данных, а затем доработать.
Мне нужно применить следующую логику, но давайте определим несколько вещей >
Родительский узел — это узел, который начинается с WP или CH в столбце "Кодекс", но никогда не имеет "."
Каждый родительский узел имеет дочерние узлы , в формате PARENT_NODE + ".A" + номер
Если для родительского элемента значение "% di completamento" установлено на 100 %, отфильтруйте родительский + дочерние элементы
В противном случае сохраните в новый df оставшиеся родительские узлы (те, которые не 100%).
Приведенный ниже код никогда не работает правильно. Собирает готовый на 100% материал
[..] некоторый код для загрузки Excel в df (с именем df)

Код: Выделить всё

# Identify parent nodes (those that don't have a '.' in 'Codice' and do not start with 'PRO')
df['is_parent'] = ~df['Codice'].str.contains('\.', na=False) & ~df['Codice'].str.startswith('PRO', na=False)

# Identify parent nodes that are not 100% complete
incomplete_parents = df.loc[df['is_parent'] & ((df['% di completamento'] != 100)| (df['% di completamento'] != 1.00)), 'Codice']

# We want to keep rows that are children of non-complete parents or are parents themselves
# Note: It's important to ensure the 'Codice' column doesn't have NaN values for this operation
df['keep'] = df['Codice'].isin(incomplete_parents) | df['Codice'].str.contains(r'\.', na=False)

# Apply the filter to the DataFrame to keep desired rows
filtered_df = df[df['keep']].copy()

# Dropping the helper columns
filtered_df.drop(columns=['is_parent', 'keep'], inplace=True)

# Now let's display the first few rows of the dataframe to verify the output
# print (filtered_df)

columns_to_save = [
'ID',
'Codice',
'Nome dell\'attività',
'Effort stimato',
'Inizio',
'Fine',
'Durata',
'Effort consuntivato + Effort Stimato mancante', # Assuming this is the correct column name
'Diff. Effort',
'% di completamento',
'Effort completato'
]

filtered_df = filtered_df[columns_to_save].dropna()

# Now filtered_df will only include parent projects that are not 100% complete and all their child tasks
print(filtered_df)

Подробнее здесь: https://stackoverflow.com/questions/782 ... lumn-value

1712658863

Anonymous

У меня есть Excel, который мне затем нужно преобразовать в фрейм данных, а затем доработать.
Мне нужно применить следующую логику, но давайте определим несколько вещей >
Родительский узел — это узел, который начинается с WP или CH в столбце "Кодекс", но никогда не имеет "."
Каждый родительский узел имеет дочерние узлы , в формате PARENT_NODE + ".A" + номер
Если для родительского элемента значение "% di completamento" установлено на 100 %, отфильтруйте родительский + дочерние элементы
В противном случае сохраните в новый df оставшиеся родительские узлы (те, которые не 100%).
Приведенный ниже код никогда не работает правильно. Собирает готовый на 100% материал
[..] некоторый код для загрузки Excel в df (с именем df)
[code]# Identify parent nodes (those that don't have a '.' in 'Codice' and do not start with 'PRO')
df['is_parent'] = ~df['Codice'].str.contains('\.', na=False) & ~df['Codice'].str.startswith('PRO', na=False)

# Identify parent nodes that are not 100% complete
incomplete_parents = df.loc[df['is_parent'] & ((df['% di completamento'] != 100)| (df['% di completamento'] != 1.00)), 'Codice']

# We want to keep rows that are children of non-complete parents or are parents themselves
# Note: It's important to ensure the 'Codice' column doesn't have NaN values for this operation
df['keep'] = df['Codice'].isin(incomplete_parents) | df['Codice'].str.contains(r'\.', na=False)

# Apply the filter to the DataFrame to keep desired rows
filtered_df = df[df['keep']].copy()

# Dropping the helper columns
filtered_df.drop(columns=['is_parent', 'keep'], inplace=True)

# Now let's display the first few rows of the dataframe to verify the output
# print (filtered_df)

columns_to_save = [
'ID',
'Codice',
'Nome dell\'attività',
'Effort stimato',
'Inizio',
'Fine',
'Durata',
'Effort consuntivato + Effort Stimato mancante', # Assuming this is the correct column name
'Diff. Effort',
'% di completamento',
'Effort completato'
]

filtered_df = filtered_df[columns_to_save].dropna()

# Now filtered_df will only include parent projects that are not 100% complete and all their child tasks
print(filtered_df)
[/code]
[img]https://i.stack.imgur.com/c5Byf.png[/img]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78297545/pythonpandas-filter-dataframe-based-on-column-value[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Изменение значения столбца в кадре данных Pandas на основе другого столбца, содержащего логические значения (слабое пред

Последнее сообщение Anonymous « 31 дек 2023, 20:58
Добавлено в форуме Python

Anonymous » 31 дек 2023, 20:58 » в форуме Python

У меня есть кадр данных Pandas, и я хотел бы изменить значение в столбце, если логическое значение в другом столбце равно True.

У меня есть код, который работает, но PyCharm выдает слабое предупреждение об использовании двойных кавычек для...

0 Ответы

141 Просмотры

Последнее сообщение Anonymous
31 дек 2023, 20:58
Установите значение столбца A, выбрав другое имя столбца на основе значения столбца B в кадре данных.

Последнее сообщение Anonymous « 04 авг 2024, 09:09
Добавлено в форуме Python

Anonymous » 04 авг 2024, 09:09 » в форуме Python

У меня есть пример DataFrame:
columns =
raw_data = [
,
,
,
]
df = pd.DataFrame(raw_data, columns=columns)

Я хочу установить значение столбца B на основе значения в имени столбца, которое соответствует значению столбца A + строке «_Input»....

0 Ответы

53 Просмотры

Последнее сообщение Anonymous
04 авг 2024, 09:09
Кадр данных Pandas получает местоположение столбца, если имя содержит строку и разбивается на несколько кадров данных.

Последнее сообщение Anonymous « 26 июн 2024, 19:54
Добавлено в форуме Python

Anonymous » 26 июн 2024, 19:54 » в форуме Python

Я читаю файл .csv, который содержит несколько столбцов временных рядов, но каждый из них имеет другое имя в зависимости от пакета. Моя цель — найти имена столбцов, которые содержат строку «TIME», и получить их номера столбцов, чтобы я мог разрезать...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 19:54
Кадр данных Pandas получает местоположение столбца, если имя содержит строку и разбивается на несколько кадров данных.

Последнее сообщение Anonymous « 26 июн 2024, 20:35
Добавлено в форуме Python

Anonymous » 26 июн 2024, 20:35 » в форуме Python

Я читаю файл .csv, который содержит несколько столбцов временных рядов, но каждый из них имеет другое имя в зависимости от пакета. Моя цель — найти имена столбцов, которые содержат строку «TIME», и получить их номера столбцов, чтобы я мог разрезать...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 20:35
Установите значение столбца B на основе значения в имени столбца, которое соответствует значению столбца A

Последнее сообщение Anonymous « 06 авг 2024, 06:10
Добавлено в форуме Python

Anonymous » 06 авг 2024, 06:10 » в форуме Python

У меня есть пример фрейма данных:
columns =
raw_data = [
,
,
,
]
df = pd.DataFrame(raw_data, columns=columns)

Я хочу установить значение столбца B на основе значения в имени столбца, которое соответствует значению столбца A + строке «_Input»....

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
06 авг 2024, 06:10

Вернуться в «Python»