Как применить функцию Пуассона numpy к столбцу Polars и найти наиболее частый результат? - Цифровое Кемерово

Как применить функцию Пуассона numpy к столбцу Polars и найти наиболее частый результат? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как применить функцию Пуассона numpy к столбцу Polars и найти наиболее частый результат?

Цитата

Сообщение Anonymous » 27 ноя 2024, 23:55

Я пытаюсь работать с библиотекой Polars в Python, и мне нужно использовать функцию Пуассона numpy для каждого значения столбца. В частности, я хочу создать несколько выборок (например, 1000) для каждого значения в столбце и определить наиболее частую выборку (режим) для каждой строки.
Например, учитывая следующий DataFrame :

Код: Выделить всё

import polars as pl

df = pl.DataFrame({
"HomeLambda": [1.5, 2.0, 3.2]
})

Я хочу:

Применить np.random.poisson(lam=HomeLambda, size=1000) для каждого row.
Подсчитайте вхождения каждого значения в 1000 образцов.
Найдите значение с наибольшим количеством (режим) для каждой строки.< /li>

Ожидаемый результат будет выглядеть так:

Код: Выделить всё

shape: (3, 2)
┌─────────────┬──────────────┐
│ HomeLambda  │ PredictedHome│
│ ---         │ ---          │
│ f64         │ i64          │
├─────────────┼──────────────┤
│ 1.5         │ 1            │
│ 2.0         │ 2            │
│ 3.2         │ 3            │
└─────────────┴──────────────┘

Как я могу эффективно добиться этого в Polars?
Моя первоначальная попытка выглядела примерно так, но я не могу понять, как включить np .random.poisson в рабочий процесс Polars:

Код: Выделить всё

lambda_table.with_columns(
pl.Series(rng.poisson(lam=pl.col("HomeLambda"), size=1000)).value_counts().top_k(k=1,by="count")['count'].item().alias("PredictedHome"),
)

Есть какие-нибудь предложения или рекомендации по интеграции функций numpy с Polars и выполнению такого рода операций над строками?

Подробнее здесь: https://stackoverflow.com/questions/792 ... most-frequ

1732740917

Anonymous

Я пытаюсь работать с библиотекой Polars в Python, и мне нужно использовать функцию Пуассона numpy для каждого значения столбца. В частности, я хочу создать несколько выборок (например, 1000) для каждого значения в столбце и определить наиболее частую выборку (режим) для каждой строки.
Например, учитывая следующий DataFrame :
[code]import polars as pl

df = pl.DataFrame({
"HomeLambda": [1.5, 2.0, 3.2]
})
[/code]
Я хочу:
[list]
[*]Применить np.random.poisson(lam=HomeLambda, size=1000) для каждого row.
[*]Подсчитайте вхождения каждого значения в 1000 образцов.
Найдите значение с наибольшим количеством (режим) для каждой строки.< /li>
[/list]
Ожидаемый результат будет выглядеть так:
[code]shape: (3, 2)
┌─────────────┬──────────────┐
│ HomeLambda  │ PredictedHome│
│ ---         │ ---          │
│ f64         │ i64          │
├─────────────┼──────────────┤
│ 1.5         │ 1            │
│ 2.0         │ 2            │
│ 3.2         │ 3            │
└─────────────┴──────────────┘
[/code]
Как я могу эффективно добиться этого в Polars?
Моя первоначальная попытка выглядела примерно так, но я не могу понять, как включить np .random.poisson в рабочий процесс Polars:
[code]lambda_table.with_columns(
pl.Series(rng.poisson(lam=pl.col("HomeLambda"), size=1000)).value_counts().top_k(k=1,by="count")['count'].item().alias("PredictedHome"),
)
[/code]
Есть какие-нибудь предложения или рекомендации по интеграции функций numpy с Polars и выполнению такого рода операций над строками? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79227307/how-to-apply-numpys-poisson-function-on-a-polars-column-and-find-the-most-frequ[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»