Оптимизация комбинаций переменных для максимизации классификацииPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Оптимизация комбинаций переменных для максимизации классификации

Сообщение Anonymous »

Я работаю с набором данных, в котором пользователи взаимодействуют через приложение или веб-сайт, и мне нужно определить оптимальную комбинацию переменных (x1, x2,... xn), которая позволит максимизировать количество пользователей классифицируются как «Любители приложений». Согласно бизнес-правилу, пользователь считается «любителем приложений», если он использует приложение более 66 % времени.
Вот упрощенный пример структуры данных:
Вот упрощенный пример структуры данных:
Вот упрощенный пример структуры данных:
р>

Код: Выделить всё

import polars as pl
df = pl.DataFrame({
"ID": [1, 2, 3, 1, 2, 3, 1, 2, 3],
"variable": ["x1", "x1", "x1", "x2", "x2", "x2", "x3", "x3", "x3"],
"Favourite": ["APP", "APP", "WEB", "APP", "WEB", "APP", "APP", "APP", "WEB"]
})
В этом наборе данных каждый идентификатор представляет пользователя, а переменная относится к функции (например, x1, x2, x3), причем Избранное указывает, была ли функция выполнена через приложение или через веб-сайт.
Я поворачиваю данные, чтобы подсчитать, сколько действий было выполнено через приложение или через Интернет:

Код: Выделить всё

(
df
.pivot(
index=["ID"],
on="Favourite",
values=["variable"],
aggregate_function=pl.col("Favourite").len()
).fill_null(0)
)
Выход:

Код: Выделить всё

shape: (3, 3)
┌─────┬─────┬─────┐
│ ID  ┆ APP ┆ WEB │
│ --- ┆ --- ┆ --- │
│ i64 ┆ u32 ┆ u32 │
╞═════╪═════╪═════╡
│ 1   ┆ 3   ┆ 0   │
│ 2   ┆ 2   ┆ 1   │
│ 3   ┆ 1   ┆ 2   │
└─────┴─────┴─────┘
Далее я рассчитываю долю использования приложения каждым пользователем и классифицирую их:

Код: Выделить всё

(
df2
.with_columns(
Total = pl.col("APP") + pl.col("WEB")
)
.with_columns(
Proportion = pl.col("APP") / pl.col("Total")
)
.with_columns(
pl
.when(pl.col("Proportion") >= 0.6).then(pl.lit("APP Lover"))
.when(pl.col("Proportion") > 0.1).then(pl.lit("BOTH"))
.otherwise(pl.lit("Inactive"))
)
)

shape: (3, 6)
┌─────┬─────┬─────┬───────┬────────────┬───────────┐
│ ID  ┆ APP ┆ WEB ┆ Total ┆ Proportion ┆ literal   │
│ --- ┆ --- ┆ --- ┆ ---   ┆ ---        ┆ ---       │
│ i64 ┆ u32 ┆ u32 ┆ u32   ┆ f64        ┆ str       │
╞═════╪═════╪═════╪═══════╪════════════╪═══════════╡
│ 1   ┆ 3   ┆ 0   ┆ 3     ┆ 1.0        ┆ APP Lover │
│ 2   ┆ 2   ┆ 1   ┆ 3     ┆ 0.666667   ┆ APP Lover │
│ 3   ┆ 1   ┆ 2   ┆ 3     ┆ 0.333333   ┆ BOTH      │
└─────┴─────┴─────┴───────┴────────────┴───────────┘
Задача: в моем реальном наборе данных есть как минимум 19 различных переменных x. Вчера меня спросили: я попробовал перебрать все возможные комбинации этих переменных, чтобы отфильтровать те, которые приводят к наибольшему количеству «любителей приложений», но количество комбинаций (2^19) слишком велико для эффективного вычисления. .
Вопрос: Как мне эффективно определить наилучшую комбинацию переменных xn, которая максимизирует число «любителей приложений»? Мне нужны рекомендации о том, как подойти к этому с точки зрения алгоритмической оптимизации или более эффективных итераций.

Подробнее здесь: https://stackoverflow.com/questions/790 ... sification
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Оптимизация комбинаций переменных для максимизации классификации
    Anonymous » » в форуме Python
    0 Ответы
    15 Просмотры
    Последнее сообщение Anonymous
  • Оптимизация комбинаций переменных для максимизации классификации
    Anonymous » » в форуме Python
    0 Ответы
    9 Просмотры
    Последнее сообщение Anonymous
  • Оптимизация комбинаций переменных для максимизации классификации
    Anonymous » » в форуме Python
    0 Ответы
    12 Просмотры
    Последнее сообщение Anonymous
  • Оптимизация комбинаций переменных для максимизации классификации
    Anonymous » » в форуме Python
    0 Ответы
    13 Просмотры
    Последнее сообщение Anonymous
  • Оптимизация фильтрованных комбинаций комбинаций
    Anonymous » » в форуме Python
    0 Ответы
    20 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»