Qcut не находит квантили (много 0 и 1 дублируются в моем df)

Qcut не находит квантили (много 0 и 1 дублируются в моем df) ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Qcut не находит квантили (много 0 и 1 дублируются в моем df)

Цитата

Сообщение Anonymous » 02 июн 2024, 10:26

У меня есть столбец моего df со столбцом MAX_PERC в диапазоне от 0 до 1.

Количество нулей — 103168. li>
Количество единиц — 32364.
Количество наблюдений меньше 1 и больше 0,8 — 2594.
< li>Количество наблюдений больше 0 и меньше 0,8 равно 129.

Я пытаюсь использовать pd.qcut, чтобы найти квантилей, он работает (т.е. находит более одного квантиля) только для более высокого квантиля, например (>0,8)

Код: Выделить всё

pd.qcut(df['MAX_PERC'],80,retbins=True, duplicates='drop')

Чтобы воссоздать фрейм данных:

Код: Выделить всё

    # Define the counts
count_zeros = 103168
count_ones = 32364
count_between_08_1 = 2594
count_between_0_08 = 129

# Create arrays for each range
zeros = np.zeros(count_zeros)
ones = np.ones(count_ones)
between_08_1 = np.random.uniform(0.8, 1.0, count_between_08_1)
between_0_08 = np.random.uniform(0, 0.8, count_between_0_08)

# Combine all arrays
all_values = np.concatenate([zeros, ones, between_08_1, between_0_08])

# Shuffle the array to mix the values
np.random.shuffle(all_values)

# Create the DataFrame
df = pd.DataFrame({'MAX_PERC': all_values})

Почему? не должен уметь вычислять квантили при 2?

Подробнее здесь: https://stackoverflow.com/questions/785 ... d-in-my-df

1717313189

Anonymous

У меня есть столбец моего df со столбцом MAX_PERC в диапазоне от 0 до 1.
[list]
[*]Количество нулей — 103168. li>
Количество единиц — 32364.
[*]Количество наблюдений меньше 1 и больше 0,8 — 2594.
< li>Количество наблюдений больше 0 и меньше 0,8 равно 129.
[/list]
Я пытаюсь использовать pd.qcut, чтобы найти квантилей, он работает (т.е. находит более одного квантиля) только для более высокого квантиля, например (>0,8)
[code]pd.qcut(df['MAX_PERC'],80,retbins=True, duplicates='drop')
[/code]
Чтобы воссоздать фрейм данных:
[code]    # Define the counts
count_zeros = 103168
count_ones = 32364
count_between_08_1 = 2594
count_between_0_08 = 129

# Create arrays for each range
zeros = np.zeros(count_zeros)
ones = np.ones(count_ones)
between_08_1 = np.random.uniform(0.8, 1.0, count_between_08_1)
between_0_08 = np.random.uniform(0, 0.8, count_between_0_08)

# Combine all arrays
all_values = np.concatenate([zeros, ones, between_08_1, between_0_08])

# Shuffle the array to mix the values
np.random.shuffle(all_values)

# Create the DataFrame
df = pd.DataFrame({'MAX_PERC': all_values})
[/code]
Почему? не должен уметь вычислять квантили при 2? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78553974/qcut-is-not-finding-quantiles-many-0s-and-1s-duplicated-in-my-df[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как pd.qcut Python может дать тот же результат, что и STATAR::xtile R?

Последнее сообщение Anonymous « 28 сен 2024, 17:00
Добавлено в форуме Python

Anonymous » 28 сен 2024, 17:00 » в форуме Python

Мне нужно создать ячейки на основе одного столбца в кадре данных. Одна из проблем заключается в том, что значения этого столбца распределены странным образом. Следовательно, pd.qcut Python может произвольно помещать наблюдения в разные ячейки, даже...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
28 сен 2024, 17:00
Как pd.qcut Python может дать тот же результат, что и STATAR::xtile R?

Последнее сообщение Anonymous « 02 окт 2024, 21:05
Добавлено в форуме Python

Anonymous » 02 окт 2024, 21:05 » в форуме Python

Мне нужно создать ячейки на основе одного столбца в кадре данных. Одна из проблем заключается в том, что значения этого столбца распределены странным образом. Следовательно, pd.qcut Python может произвольно помещать наблюдения в разные ячейки, даже...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
02 окт 2024, 21:05
Существует ли библиотека или методология Python, которая создает хорошие нелинейные квантили для двухмерных данных? [зак

Последнее сообщение Anonymous « 03 окт 2024, 12:04
Добавлено в форуме Python

Anonymous » 03 окт 2024, 12:04 » в форуме Python

Я хочу разделить свои нелинейные наборы данных на квантили с помощью Python.
Я хочу построить графики с помощью

квантилей линии, которые не пересекаются
а также имеют свою индивидуальную форму, соответствующую данным (а не просто одну и ту же...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 12:04
Существует ли библиотека или методология Python, которая создает хорошие нелинейные квантили для двухмерных данных? [зак

Последнее сообщение Anonymous « 09 окт 2024, 01:07
Добавлено в форуме Python

Anonymous » 09 окт 2024, 01:07 » в форуме Python

Я хочу разделить свои нелинейные наборы данных на квантили с помощью Python.
Я хочу построить графики с помощью

квантилей линии, которые не пересекаются
а также имеют свою индивидуальную форму, соответствующую данным (а не просто одну и ту же...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 01:07
Квантили ряда с полярами в качестве кадра данных

Последнее сообщение Anonymous « 10 окт 2024, 16:00
Добавлено в форуме Python

Anonymous » 10 окт 2024, 16:00 » в форуме Python

Предположим, у меня есть фрейм данных в полярах с результатом столбца, который представляет собой некоторое число с плавающей запятой.
df = pl.from_repr(
┌─────┬──────────┐
│ a ┆ outcome │
│ --- ┆ --- │
│ i64 ┆ f64 │
╞═════╪══════════╡
│ 2 ┆...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
10 окт 2024, 16:00

Вернуться в «Python»