У меня есть набор данных, который выглядит следующим образом:
Обзор
рекомендация
имя_игры
Отзыв...хороший
Рекомендую
Игра 1
Обзор...плохой
Не рекомендуется
Игра 1
худшая игра
Не рекомендуется
Игра 1
Обзор... Не рекомендуется
Не рекомендуется
Игра 1
Обзор... потрясающе
Рекомендую
Игра 2
Обзор... игра норм
Не рекомендуется
Игра 2
Обзор... игра не интересная
Не рекомендуется
Игра 2
потрясающая
Рекомендую
Игра 2
Хорошая игра..рекомендую
Рекомендуется
Игра 3
Обзор...хорошоРекомендуется
Игра 3
Обзор... хорошо
Рекомендуется
Игра 3
Я намерен обобщить таблицу, подсчитав количество случаев «Рекомендуется» и «Не рекомендуется» для каждой игры на основе приведенного ниже условия:IF Count(рекомендуется) > = Count(не рекомендуется) THEN OUTPUT Рекомендуется
IF Count(рекомендуется) < Count(не рекомендуется) THEN OUTPUT Не рекомендуется
Окончательный результат, который я ожидаю, — это новый или измененный фрейм данных, который выглядит следующим образом:
Рекомендуется
имя_игры
Не рекомендуется
Игра 1
Рекомендуется
Игра 2
Рекомендуется
Игра 3
Я попробовал оператор groupby ниже, но не уверен, как мне действовать дальше:
df['recommended'] = df.groupby(['game_name','recommendation'])['recommendation'].transform('count')
Подробнее здесь: https://stackoverflow.com/questions/790 ... -dataframe
Как сравнить количество значений двух сгруппированных столбцов в DataFrame? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как сравнить количество значений двух сгруппированных столбцов в DataFrame?
Anonymous » » в форуме Python - 0 Ответы
- 8 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как преобразовать Pyspark DataFrame в список словарей, сгруппированных по столбцу
Anonymous » » в форуме Python - 0 Ответы
- 2 Просмотры
-
Последнее сообщение Anonymous
-