Qcut не находит квантили (много 0 и 1 дублируются в моем df)Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Qcut не находит квантили (много 0 и 1 дублируются в моем df)

Сообщение Anonymous »

У меня есть столбец моего df со столбцом MAX_PERC в диапазоне от 0 до 1.
  • Количество нулей — 103168. li>
    Количество единиц — 32364.
  • Количество наблюдений меньше 1 и больше 0,8 — 2594.
    < li>Количество наблюдений больше 0 и меньше 0,8 равно 129.
Я пытаюсь использовать pd.qcut, чтобы найти квантилей, он работает (т.е. находит более одного квантиля) только для более высокого квантиля, например (>0,8)

Код: Выделить всё

pd.qcut(df['MAX_PERC'],80,retbins=True, duplicates='drop')
Чтобы воссоздать фрейм данных:

Код: Выделить всё

    # Define the counts
count_zeros = 103168
count_ones = 32364
count_between_08_1 = 2594
count_between_0_08 = 129

# Create arrays for each range
zeros = np.zeros(count_zeros)
ones = np.ones(count_ones)
between_08_1 = np.random.uniform(0.8, 1.0, count_between_08_1)
between_0_08 = np.random.uniform(0, 0.8, count_between_0_08)

# Combine all arrays
all_values = np.concatenate([zeros, ones, between_08_1, between_0_08])

# Shuffle the array to mix the values
np.random.shuffle(all_values)

# Create the DataFrame
df = pd.DataFrame({'MAX_PERC': all_values})
Почему? не должен уметь вычислять квантили при 2?

Подробнее здесь: https://stackoverflow.com/questions/785 ... d-in-my-df
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»