Максимизация классификации Corretc с помощью пульпы

Максимизация классификации Corretc с помощью пульпы ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Максимизация классификации Corretc с помощью пульпы

Цитата

Сообщение Anonymous » 19 фев 2025, 02:13

В Python я пытаюсь решить проблему линейной оптимизации с помощью пакета пульпы.
Я имею n непрерывных показателей и дихотомическая цель. Мне нужно выбрать подмножество индикаторов M и порог для каждого индикатора, чтобы, если по крайней мере, индикаторы P выше их порога, запись классифицируется как 1.
Проблема оптимизации должна определить эти переменные: < /p>
Число M переменной подмножества < /li>
Число P минимального индикатора, которого можно нарушить < /li>
Порог для каждой переменной < /li>
< /ul>
Окончательная область - неправильно классифицировать как 1 не более 10 0s цели, максимизируя классификацию 1s < /p>
В дальнейшем мой пример кода… Я не понимаю, почему он настраивает очень высокие пороговые значения, и никакие записи не классифицируются как 1. < /p>
import pandas as pd
import numpy as np
from imblearn.over_sampling import SMOTE
from pulp import LpMaximize, LpProblem, LpVariable, lpSum, value

# Sample data
np.random.seed(42)
data = pd.DataFrame(np.random.rand(1000, 10), columns=[f'X{i}' for i in range(10)]) # 10 continuous indicators
data['target'] = np.random.choice([0, 1], size=1000, p=[0.7, 0.3]) # Binary target (30% ones)

# Parameters
M = 5 # Number of selected indicators
S = 3 # Minimum number of indicators above threshold to classify as 1
max_false_positives = 100 # Maximum allowed misclassified 0s

# Define model
model = LpProblem("Indicator_Selection", LpMaximize)

# Decision variables
X = {i: LpVariable(f'X_{i}', cat='Binary') for i in range(data.shape[1] - 1)} # Indicator selection
T = {i: LpVariable(f'T_{i}', lowBound=-100, upBound=100, cat='Continuous') for i in range(data.shape[1] - 1)} # Thresholds
Y = {j: LpVariable(f'Y_{j}', cat='Binary') for j in range(len(data))} # Predicted labels

# Auxiliary binary variables to represent whether each indicator exceeds its threshold
Z = {(j, i): LpVariable(f'Z_{j}_{i}', cat='Binary') for j in range(len(data)) for i in X}

# Constraint: Select exactly M indicators
model += lpSum(X for i in X) = T, 0 otherwise)
M_large = 1 # Upper bound for continuous values
for j in range(len(data)):
for i in X:
model += Z[j, i] >= (data.iloc[j, i] - T) / M_large
model += Z[j, i]

Подробнее здесь: https://stackoverflow.com/questions/794 ... -with-pulp

1739920433

Anonymous

 В Python я пытаюсь решить проблему линейной оптимизации с помощью пакета пульпы.
Я имею n непрерывных показателей и дихотомическая цель. Мне нужно выбрать подмножество индикаторов M и порог для каждого индикатора, чтобы, если по крайней мере, индикаторы P выше их порога, запись классифицируется как 1.
Проблема оптимизации должна определить эти переменные: < /p>  
 Число M переменной подмножества < /li>
 Число P минимального индикатора, которого можно нарушить < /li>
 Порог для каждой переменной < /li>
< /ul>
Окончательная область - неправильно классифицировать как 1 не более 10 0s цели, максимизируя классификацию 1s < /p>
В дальнейшем мой пример кода… Я не понимаю, почему он настраивает очень высокие пороговые значения, и никакие записи не классифицируются как 1. < /p>
import pandas as pd
import numpy as np
from imblearn.over_sampling import SMOTE
from pulp import LpMaximize, LpProblem, LpVariable, lpSum, value

# Sample data
np.random.seed(42)
data = pd.DataFrame(np.random.rand(1000, 10), columns=[f'X{i}' for i in range(10)])  # 10 continuous indicators
data['target'] = np.random.choice([0, 1], size=1000, p=[0.7, 0.3])  # Binary target (30% ones)

# Parameters
M = 5  # Number of selected indicators
S = 3  # Minimum number of indicators above threshold to classify as 1
max_false_positives = 100  # Maximum allowed misclassified 0s

# Define model
model = LpProblem("Indicator_Selection", LpMaximize)

# Decision variables
X = {i: LpVariable(f'X_{i}', cat='Binary') for i in range(data.shape[1] - 1)}  # Indicator selection
T = {i: LpVariable(f'T_{i}', lowBound=-100, upBound=100, cat='Continuous') for i in range(data.shape[1] - 1)}  # Thresholds
Y = {j: LpVariable(f'Y_{j}', cat='Binary') for j in range(len(data))}  # Predicted labels

# Auxiliary binary variables to represent whether each indicator exceeds its threshold
Z = {(j, i): LpVariable(f'Z_{j}_{i}', cat='Binary') for j in range(len(data)) for i in X}

# Constraint: Select exactly M indicators
model += lpSum(X[i] for i in X) = T[i], 0 otherwise)
M_large = 1  # Upper bound for continuous values
for j in range(len(data)):
for i in X:
model += Z[j, i] >= (data.iloc[j, i] - T[i]) / M_large
model += Z[j, i] 

Подробнее здесь: [url]https://stackoverflow.com/questions/79448413/maximizing-corretc-classification-with-pulp[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Максимизация правильной классификации с помощью пульпы

Последнее сообщение Anonymous « 22 фев 2025, 17:58
Добавлено в форуме Python

Anonymous » 22 фев 2025, 17:58 » в форуме Python

В Python я пытаюсь решить проблему линейной оптимизации с помощью пакета пульпы. Мне нужно выбрать подмножество максимально m индикаторов M и порог для каждого индикатора, чтобы, если по крайней мере, индикаторы P выше их порога, запись...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
22 фев 2025, 17:58
Максимизация правильной классификации с помощью пульпы

Последнее сообщение Anonymous « 24 фев 2025, 11:05
Добавлено в форуме Python

Anonymous » 24 фев 2025, 11:05 » в форуме Python

В Python я пытаюсь решить проблему линейной оптимизации с помощью пакета пульпы. Мне нужно выбрать подмножество максимально m индикаторов M и порог для каждого индикатора, чтобы, если по крайней мере, индикаторы P выше их порога, запись...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 11:05
Рассчитать кривую ROC, отчет о классификации и матрицу путаницы для задачи классификации по нескольким меткам.

Последнее сообщение Anonymous « 02 дек 2024, 15:40
Добавлено в форуме Python

Anonymous » 02 дек 2024, 15:40 » в форуме Python

Я пытаюсь понять, как создать матрицу путаницы и кривую ROC для моей задачи классификации по нескольким меткам. Я строю нейронную сеть.
Вот мои занятия:
mlb = MultiLabelBinarizer()
ohe = mlb.fit_transform(as_list)
# loop over each of the possible...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 15:40
Обнаружение статуса предварительного разрешения в модели пульпы

Последнее сообщение Anonymous « 06 дек 2023, 14:26
Добавлено в форуме Python

Anonymous » 06 дек 2023, 14:26 » в форуме Python

Привет, я использую модель с использованием CBC целлюлозы, и у меня мало ограничений в модели, которые могут сделать модель невыполнимой, если в модель будут введены неправильные входные данные.

Пока моя модель работает, я вижу, что в случае...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
06 дек 2023, 14:26
Модель пульпы неосуществима, но дает осуществимые результаты

Последнее сообщение Anonymous « 11 июл 2024, 23:40
Добавлено в форуме Python

Anonymous » 11 июл 2024, 23:40 » в форуме Python

В настоящее время я работаю над кодом, который сможет решить наш график распределения каждый день, без необходимости заставлять кого-то в компании делать это каждое утро. В настоящее время у меня есть следующий код:
data =

df_stint =...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
11 июл 2024, 23:40

Вернуться в «Python»