Как удалить минимально возможное количество строк в наборе данных из двух столбцов, чтобы каждый столбец имел уникальные

Как удалить минимально возможное количество строк в наборе данных из двух столбцов, чтобы каждый столбец имел уникальные ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как удалить минимально возможное количество строк в наборе данных из двух столбцов, чтобы каждый столбец имел уникальные

Цитата

Сообщение Anonymous » 10 апр 2024, 09:47

Я использую фрейм данных pandas, я думал об использовании максимального потока в networkx, но думаю, что это немного излишество, есть ли альтернатива?
Я пытался использовать
import pandas as pd

# Create a sample DataFrame
df = pd.DataFrame({'column1': [1, 2, 3, 1, 3, 4],
'column2': [5, 6, 7, 8, 9, 7]})

print("Original DataFrame:")
print(df)

# Function to remove the lowest possible number of rows
def remove_duplicate_rows(df):
# Get the unique values in each column
df.drop_duplicates(subset='column1', inplace=True)

df.drop_duplicates(subset='column2', inplace=True)

# Apply the mask to the DataFrame and return the result
return df

# Apply the function to the DataFrame
result = remove_duplicate_rows(df)

print("\nResulting DataFrame:")
print(result)

Выход:
Original DataFrame:
column1 column2
0 1 5
1 2 6
2 3 7
3 1 8
4 3 9
5 4 7

Resulting DataFrame:
column1 column2
0 1 5
1 2 6
2 3 7

При удалении слишком большого количества строк допустимый результат может быть следующим:
Resulting DataFrame:
column1 column2
0 1 5
1 2 6
2 3 9
3 4 7

Подробнее здесь: https://stackoverflow.com/questions/783 ... wo-columns

1712731635

Anonymous

Я использую фрейм данных pandas, я думал об использовании максимального потока в networkx, но думаю, что это немного излишество, есть ли альтернатива?
Я пытался использовать
import pandas as pd

# Create a sample DataFrame
df = pd.DataFrame({'column1': [1, 2, 3, 1, 3, 4],
'column2': [5, 6, 7, 8, 9, 7]})

print("Original DataFrame:")
print(df)

# Function to remove the lowest possible number of rows
def remove_duplicate_rows(df):
# Get the unique values in each column
df.drop_duplicates(subset='column1', inplace=True)

df.drop_duplicates(subset='column2', inplace=True)

# Apply the mask to the DataFrame and return the result
return df

# Apply the function to the DataFrame
result = remove_duplicate_rows(df)

print("\nResulting DataFrame:")
print(result)

Выход:
Original DataFrame:
column1  column2
0        1        5
1        2        6
2        3        7
3        1        8
4        3        9
5        4        7

Resulting DataFrame:
column1  column2
0        1        5
1        2        6
2        3        7

При удалении слишком большого количества строк допустимый результат может быть следующим:
Resulting DataFrame:
column1  column2
0        1        5
1        2        6
2        3        9
3        4        7
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78302325/how-can-i-remove-the-lowest-possible-amount-of-rows-in-a-dataset-of-two-columns[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как удалить минимально возможное количество строк в наборе данных из двух столбцов, чтобы каждый столбец имел уникальные

Последнее сообщение Anonymous « 10 апр 2024, 10:47
Добавлено в форуме Python

Anonymous » 10 апр 2024, 10:47 » в форуме Python

Я использую фрейм данных pandas, я думал об использовании максимального потока в networkx, но думаю, что это немного излишество, есть ли альтернатива?
Я пытался использовать
import pandas as pd

# Create a sample DataFrame
df =...

0 Ответы

48 Просмотры

Последнее сообщение Anonymous
10 апр 2024, 10:47
Как изменить/развернуть несколько столбцов в наборе данных и разделить полученные значения на разное количество столбцов

Последнее сообщение Anonymous « 18 сен 2024, 18:49
Добавлено в форуме Python

Anonymous » 18 сен 2024, 18:49 » в форуме Python

Я пытаюсь реструктурировать фрейм данных, объединив значения из нескольких пар столбцов в один столбец для каждой пары. Например, у меня есть столбец age_pre и столбец age_post, и я хочу объединить эти два столбца в один столбец age. То же самое со...

0 Ответы

87 Просмотры

Последнее сообщение Anonymous
18 сен 2024, 18:49
Как изменить/развернуть несколько столбцов в наборе данных и разделить полученные значения на разное количество столбцов

Последнее сообщение Anonymous « 11 окт 2024, 02:48
Добавлено в форуме Python

Anonymous » 11 окт 2024, 02:48 » в форуме Python

Я пытаюсь реструктурировать фрейм данных, объединяя значения из нескольких пар столбцов в один столбец для каждой пары. Например, у меня есть столбец age_pre и столбец age_post, и я хочу объединить эти два столбца в один столбец age. То же самое со...

0 Ответы

83 Просмотры

Последнее сообщение Anonymous
11 окт 2024, 02:48
C ++ STD :: Уникальные возвраты явно не уникальные результаты

Последнее сообщение Anonymous « 18 июл 2025, 23:48
Добавлено в форуме C++

Anonymous » 18 июл 2025, 23:48 » в форуме C++

Я экспериментировал с C ++ STD :: уникальные функции, но результаты, которые он возвращает, действительно меня смущает. Я сделал простую функцию, чтобы проверить его, например,
#include
#include
#include

int main()
{
std::vector test;
for(int i...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
18 июл 2025, 23:48
Увеличить значение плавающей запятой Python на наименьшее возможное количество

Последнее сообщение Anonymous « 29 май 2025, 14:17
Добавлено в форуме Python

Anonymous » 29 май 2025, 14:17 » в форуме Python

Как я могу увеличить значение с плавающей запятой в питоне наименьшим возможным количеством? Я хотел бы разрешить их, увеличивая значение плавающей запятой на максимально небольшую сумму. Как я могу это сделать?

Подробнее здесь:

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
29 май 2025, 14:17

Вернуться в «Python»