Найдите дубликаты в столбце pandas вложенных списков в предыдущих строках с несколькими условиями.Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Найдите дубликаты в столбце pandas вложенных списков в предыдущих строках с несколькими условиями.

Сообщение Anonymous »

Я немного не понимаю, как это закодировать.
У меня есть такой набор данных:

Код: Выделить всё

rules   user_list       event_time          row_number
rule1   123,244,344     2024-09-20          1
rule1   125,346,421     2024-09-19          2
rule1   125,343,431     2024-09-18          3
rule2   125,344,423     2024-09-20          1
rule2   125,346,421     2024-09-19          2
rule3   125,348,331     2024-09-20          1
rule3   125,336,221     2024-09-19          2
воспроизводимость

Код: Выделить всё

data = {
'rules': ['rule1', 'rule1', 'rule1', 'rule2', 'rule2', 'rule3', 'rule3'],
'user_list': ['123,244,344', '125,346,421', '125,343,431', '125,344,423', '125,346,421', '125,348,331', '125,336,221'],
'event_time': ['2024-09-20', '2024-09-19', '2024-09-18', '2024-09-20', '2024-09-19', '2024-09-20', '2024-09-19'],
'row_number': [1, 2, 3, 1, 2, 1, 2]
}
data = pd.DataFrame(data)
data['event_time'] = pd.to_datetime(data['event_time'])
Я пытаюсь создать другой столбец, который подсчитывает/находит количество user_ids из последних строк правил (где row_number = 1), которые находятся в других строках за прошедший день и где находится правило. это другое правило (поэтому подсчитайте дубликатов пользователей, которые активировали разные правила в течение прошлого дня).
Итоговая таблица должна выглядеть следующим образом:

Код: Выделить всё

rules   user_list       event_time          row_number      dupe_users
rule1   123,244,344     2024-09-20          1               344
rule1   125,346,421     2024-09-19          2               125,125,346,421
rule1   125,343,431     2024-09-18          3               125
rule2   125,344,423     2024-09-20          1               125,344
rule2   125,346,421     2024-09-19          2               125,125,346,421
rule3   125,348,331     2024-09-20          1               125,125
rule3   125,336,221     2024-09-19          2               125,125
пример: пользователь 344 был замечен по правилу 1 20 сентября 2024 г. и по правилу 2 20 сентября 2024 г.

Подробнее здесь: https://stackoverflow.com/questions/790 ... s-with-mul
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»