Я посмотрел на этот пост, но, похоже, он не имеет надежного решения проблемы.
Код: Выделить всё
df = pd.read_csv('https://raw.githubusercontent.com/108michael/ms_thesis/master/crsp.dime.mpl.df')
df.groupby('date')['cid'].agg(['size', 'nunique'])
size nunique
date
2005 7 3
2006 237 10
2007 3610 227
2008 1318 52
2009 2664 142
2010 997 57
2011 6390 219
2012 2904 99
2013 7875 238
2014 3979 146
< /code>
Вещи, которые я пробовал: < /p>
[list]
[*]df.groupby([df['date']]).drop_duplicates(cols='cid')Код: Выделить всё
df.groupby(('date').drop_duplicates('cid'))[/list]
Подробнее здесь: https://stackoverflow.com/questions/371 ... as-groupby