Python Polars, кодирующие непрерывные переменные из точек останова в другом раме данных

Python Polars, кодирующие непрерывные переменные из точек останова в другом раме данных ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Python Polars, кодирующие непрерывные переменные из точек останова в другом раме данных

Цитата

Сообщение Anonymous » 20 фев 2025, 01:37

Данные точек останова следующие: < /p>

Код: Выделить всё

breakpoints = pl.DataFrame(
{
"features": ["feature_0", "feature_0", "feature_1"],
"breakpoints": [0.1, 0.5, 1],
"n_possible_bins": [3, 3, 2],
}
)
print(breakpoints)
out:
shape: (3, 3)
┌───────────┬─────────────┬─────────────────┐
│ features  ┆ breakpoints ┆ n_possible_bins │
│ ---       ┆ ---         ┆ ---             │
│ str       ┆ f64         ┆ i64             │
╞═══════════╪═════════════╪═════════════════╡
│ feature_0 ┆ 0.1         ┆ 3               │
│ feature_0 ┆ 0.5         ┆ 3               │
│ feature_1 ┆ 1.0         ┆ 2               │
└───────────┴─────────────┴─────────────────┘

df имеет две непрерывные переменные, которые мы хотим кодировать в соответствии с точками останова dataFrame:

Код: Выделить всё

df = pl.DataFrame(
{"feature_0": [0.05, 0.2, 0.6, 0.8], "feature_1": [0.5, 1.5, 1.0, 1.1]}
)
print(df)
out:
shape: (4, 2)
┌───────────┬───────────┐
│ feature_0 ┆ feature_1 │
│ ---       ┆ ---       │
│ f64       ┆ f64       │
╞═══════════╪═══════════╡
│ 0.05      ┆ 0.5       │
│ 0.2       ┆ 1.5       │
│ 0.6       ┆ 1.0       │
│ 0.8       ┆ 1.1       │
└───────────┴───────────┘

После кодирования мы должны иметь полученный данных DataFrame encoded_df :

Код: Выделить всё

encoded_df = pl.DataFrame({"feature_0": [0, 1, 2, 2], "feature_1": [0, 0, 0, 1]})

print(encoded_df)
out:
shape: (4, 2)
┌───────────┬───────────┐
│ feature_0 ┆ feature_1 │
│ ---       ┆ ---       │
│ i64       ┆ i64       │
╞═══════════╪═══════════╡
│ 0         ┆ 0         │
│ 1         ┆ 0         │
│ 2         ┆ 0         │
│ 2         ┆ 1         │
└───────────┴───────────┘

[*] Мы можем предположить, что уникальный список функций в кодировании_df также доступен в точках останова
Метки должны быть массивом: np.array ([str (i) для i в диапазоне (n_possible_bins)]]) , предполагая n_possible_bins Положительное целое число. n_possible_bins может отличаться по функциями. /li>
< /ol>
Я знаю, что polars.expr.cut () принимает параметр перерывов < /code> как Последовательность [float] , но как я могу эффективно передать эти точки останова и метки с точек останова DataFrame?

Подробнее здесь: https://stackoverflow.com/questions/794 ... -dataframe

1740004633

Anonymous

 Данные точек останова следующие: < /p>
[code]breakpoints = pl.DataFrame(
{
"features": ["feature_0", "feature_0", "feature_1"],
"breakpoints": [0.1, 0.5, 1],
"n_possible_bins": [3, 3, 2],
}
)
print(breakpoints)
out:
shape: (3, 3)
┌───────────┬─────────────┬─────────────────┐
│ features  ┆ breakpoints ┆ n_possible_bins │
│ ---       ┆ ---         ┆ ---             │
│ str       ┆ f64         ┆ i64             │
╞═══════════╪═════════════╪═════════════════╡
│ feature_0 ┆ 0.1         ┆ 3               │
│ feature_0 ┆ 0.5         ┆ 3               │
│ feature_1 ┆ 1.0         ┆ 2               │
└───────────┴─────────────┴─────────────────┘
[/code]
df  имеет две непрерывные переменные, которые мы хотим кодировать в соответствии с точками останова  dataFrame:
[code]df = pl.DataFrame(
{"feature_0": [0.05, 0.2, 0.6, 0.8], "feature_1": [0.5, 1.5, 1.0, 1.1]}
)
print(df)
out:
shape: (4, 2)
┌───────────┬───────────┐
│ feature_0 ┆ feature_1 │
│ ---       ┆ ---       │
│ f64       ┆ f64       │
╞═══════════╪═══════════╡
│ 0.05      ┆ 0.5       │
│ 0.2       ┆ 1.5       │
│ 0.6       ┆ 1.0       │
│ 0.8       ┆ 1.1       │
└───────────┴───────────┘
[/code]
После кодирования мы должны иметь полученный данных DataFrame encoded_df :
[code]encoded_df = pl.DataFrame({"feature_0": [0, 1, 2, 2], "feature_1": [0, 0, 0, 1]})

print(encoded_df)
out:
shape: (4, 2)
┌───────────┬───────────┐
│ feature_0 ┆ feature_1 │
│ ---       ┆ ---       │
│ i64       ┆ i64       │
╞═══════════╪═══════════╡
│ 0         ┆ 0         │
│ 1         ┆ 0         │
│ 2         ┆ 0         │
│ 2         ┆ 1         │
└───────────┴───────────┘
[/code]

[*] Мы можем предположить, что уникальный список функций в кодировании_df  также доступен в точках останова 
 Метки должны быть массивом: np.array ([str (i) для i в диапазоне (n_possible_bins)]]) , предполагая n_possible_bins  Положительное целое число. n_possible_bins  может отличаться по функциями. /li>
< /ol>
Я знаю, что polars.expr.cut () принимает параметр перерывов < /code> как Последовательность [float] , но как я могу эффективно передать эти точки останова и метки с точек останова  DataFrame? 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79452824/python-polars-encoding-continous-variables-from-breakpoints-in-another-dataframe[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Python Polars, кодирующие непрерывные переменные из точек останова в другом раме данных

Последнее сообщение Anonymous « 20 фев 2025, 02:52
Добавлено в форуме Python

Anonymous » 20 фев 2025, 02:52 » в форуме Python

Данные точек останова следующие:
breakpoints = pl.DataFrame(
{
features : ,
breakpoints : ,
n_possible_bins : ,
}
)
print(breakpoints)
out:
shape: (3, 3)
┌───────────┬─────────────┬─────────────────┐
│ features ┆ breakpoints ┆ n_possible_bins...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 02:52
Python Polars, кодирующие непрерывные переменные из точек останова в другом раме данных

Последнее сообщение Anonymous « 20 фев 2025, 16:01
Добавлено в форуме Python

Anonymous » 20 фев 2025, 16:01 » в форуме Python

Данные точек останова следующие:
breakpoints = pl.DataFrame(
{
features : ,
breakpoints : ,
n_possible_bins : ,
}
)
print(breakpoints)
out:
shape: (3, 3)
┌───────────┬─────────────┬─────────────────┐
│ features ┆ breakpoints ┆ n_possible_bins...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 16:01
Точки останова TailwindCSS не срабатывают при достижении определенных точек останова.

Последнее сообщение Anonymous « 06 мар 2024, 15:03
Добавлено в форуме CSS

Anonymous » 06 мар 2024, 15:03 » в форуме CSS

I am working on a Next js + tailwindcss project, where I am trying to make my site responsive.

This is my component:

According to the rules, this div should start with its display set as flex, but as soon as it hits screen size md it should...

0 Ответы

96 Просмотры

Последнее сообщение Anonymous
06 мар 2024, 15:03
Точки останова Swiperjs не применяются при достижении точек останова

Последнее сообщение Гость « 26 мар 2024, 06:14
Добавлено в форуме CSS

Гость » 26 мар 2024, 06:14 » в форуме CSS

Я использую swiperjs и хочу сделать его отзывчивым, используя свойство точек останова. Однако значение по умолчанию для слайдовPerView не применяется, когда экран достигает значения, меньшего, чем точка останова. Когда я тестирую отдельный...

0 Ответы

71 Просмотры

Последнее сообщение Гость
26 мар 2024, 06:14
Фильтрация DataFrame на два столбца в другом раме DataFrame

Последнее сообщение Anonymous « 26 авг 2025, 11:10
Добавлено в форуме Python

Anonymous » 26 авг 2025, 11:10 » в форуме Python

Мне нужны некоторые советы по вопросу о пандах.name date column_1 column_11
Anne 2018-01-01 some info1 some info11
John 2018-01-01 some info1 some info11
Mark 2018-02-01 some info1 some info11
Ethan 2018-03-01 some info1 some info11
Anne 2018-04-01...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
26 авг 2025, 11:10

Вернуться в «Python»