Как выбрать разное количество строк из каждой группы в DataFramePython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как выбрать разное количество строк из каждой группы в DataFrame

Сообщение Anonymous »

У меня есть фрейм данных со столбцом категории. Df имеет разное количество строк для каждой категории.

Код: Выделить всё

category number_of_rows
cat1     19189
cat2     13193
cat3     4500
cat4     1914
cat5     568
cat6     473
cat7     216
cat8     206
cat9     197
cat10    147
cat11    130
cat12    49
cat13    38
cat14    35
cat15    35
cat16    30
cat17    29
cat18    9
cat19    4
cat20    4
cat21    1
cat22    1
cat23    1
Я хочу выбрать разное количество строк из каждой категории.
(Вместо n фиксированного количества строк из каждой категории)

Код: Выделить всё

Example input:
size_1 : {"cat1": 40, "cat2": 20, "cat3": 15, "cat4": 11, ...}
Example input:
size_2 : {"cat1": 51, "cat2": 42, "cat3": 18, "cat4": 21, ...}
На самом деле я хочу создать стратифицированную выборку с заданным количеством экземпляров, соответствующих каждой категории.

Кроме того, он должен быть выбран случайным образом. Например, мне не нужны первые 40 значений для size_1.["cat1"], мне нужны случайные 40 значений.

Спасибо за помощь.

Подробнее здесь: https://stackoverflow.com/questions/594 ... -dataframe
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»