...и для каждой группы в статусе любезно выдается ряд сводных статистических данных. Однако в моей реальной базе данных количество категорий намного больше, и для некоторых анализов я хочу отображать результаты только для ограниченного числа категорий.
В приведенном выше примере, как я могу отобразить сводную статистику только для групп статусов 1 и 2? Я пробовал различные формы, используя .loc и другие стандартные методы нарезки и нарезки кубиками, но безрезультатно. Мне удалось пройти через каждую группу индивидуально, используя цикл for, но это кажется очень неэффективным — я предполагаю, что должен быть более простой способ.
У меня есть кадр данных pandas следующего базового формата: [code]tempDF = pd.DataFrame({ 'id': [12,12,12,12,45,45,45,51,51,51,51,51,51,76,76,76,91,91,91,91], 'measure': [3.2,4.2,6.8,5.6,3.1,4.8,8.8,3.0,1.9,2.1,2.4,3.5,4.2,5.2,4.3,3.6,5.2,7.1,6.5,7.3], 'status': [0,1,1,2,1,1,0,1,0,1,2,0,0,1,1,0,1,0,2,2]}) [/code] Я хочу получить сводную статистику для каждого «статуса» на основе значения «меры». Для этого я использую: [code]tempGroup = tempDF.groupby('status') tempGroup['measure'].describe() [/code] ...и для каждой группы в статусе любезно выдается ряд сводных статистических данных. Однако в моей реальной базе данных количество категорий намного больше, и для некоторых анализов я хочу отображать результаты только для ограниченного числа категорий. В приведенном выше примере, как я могу отобразить сводную статистику только для групп статусов 1 и 2? Я пробовал различные формы, используя .loc и другие стандартные методы нарезки и нарезки кубиками, но безрезультатно. Мне удалось пройти через каждую группу индивидуально, используя цикл for, но это кажется очень неэффективным — я предполагаю, что должен быть более простой способ.