Drop Duplicates с помощью Pandas GroupbyPython

Программы на Python
Anonymous
 Drop Duplicates с помощью Pandas Groupby

Сообщение Anonymous »

В приведенном ниже DataFrame я хотел бы устранить дублирующие значения CID , чтобы вывод DF.Groupby ('date'). cid.size () соответствует выходу из df.groupby ('date'). cid.nunique () .
Я посмотрел на этот пост, но, похоже, он не имеет надежного решения проблемы.

Код: Выделить всё

df = pd.read_csv('https://raw.githubusercontent.com/108michael/ms_thesis/master/crsp.dime.mpl.df')
df.groupby('date')['cid'].agg(['size', 'nunique'])

size  nunique
date
2005      7        3
2006    237       10
2007   3610      227
2008   1318       52
2009   2664      142
2010    997       57
2011   6390      219
2012   2904      99
2013    7875    238
2014    3979    146
< /code>
Вещи, которые я пробовал: < /p>
[list]
[*]df.groupby([df['date']]).drop_duplicates(cols='cid')
дает эту ошибку: attributeError: не может получить доступ к Callable Attruitm

Код: Выделить всё

df.groupby(('date').drop_duplicates('cid'))
дает эту ошибку: attributeerror: 'str' объект не имеет атрибута 'drop_duplicates'
[/list]

Подробнее здесь: https://stackoverflow.com/questions/371 ... as-groupby

Вернуться в «Python»