Снижение точности классификатора обучения scikit после инициализации веса

Снижение точности классификатора обучения scikit после инициализации веса ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Снижение точности классификатора обучения scikit после инициализации веса

Цитата

Сообщение Anonymous » 28 июн 2024, 03:01

Я хочу реализовать базу классификатора adaboost на классификаторе sklearn, на первом этапе классификатора alg я должен инициализировать вес как «1 / # данные поезда»
но это снизит точность классификатора, я не могу понять это почему? (Я установил одинаковые веса для всех точек данных)
МОЙ КОД:
svm_weight = SVC()
svm_non_weight = SVC()

w = np.ones(len(target_train))
w.fill(float(1)/float(len(target_train)))
svm_weight.fit(data_train_feature_scaled_pca,
target_train,
sample_weight= w)

svm_non_weight.fit(data_train_feature_scaled_pca,
target_train)

print "score weight : ",svm_weight.score(data_test_feature_scaled_pca,target_train)
print "score non weight : ",svm_non_weight.score(data_test_feature_scaled_pca,target_train)

ВЫВОД:
score weight : 0.503592561285
score non weight : 0.729289940828

реализован adaboost:
class adaboost_classifier:
def __init__(self,train,target,classifier,n_estimator):
#prepairing dataset
self.N_classes = np.unique(target)
self.n_estimator = n_estimator
self.N_data = len(train)
self.trained_classifier = [[classifier,float(0),float(0), True ] for i in range(n_estimator)]
indice = []
train = np.array(train)
target = np.array(target)
dataset = np.concatenate((train,target),axis=1)
#join train and target for boosting

for i in range(len(dataset[0])-1):
indice.append(i)

self.weights = np.zeros([n_estimator,self.N_data])

# init 1/n value for weights
self.weights.fill(1/float(self.N_data))
#take sampling
new_dataset = dataset
self.N_data = len(new_dataset)
#start training sub classifier
for i in range(n_estimator):
self.loss = np.zeros(self.N_data)
#seprating training and target data
new_train = new_dataset[:,indice]
new_target = new_dataset[:,(len(dataset[0])-1)]
#train the classifier : learn f(X) with data weight
self.trained_classifier[0].fit(new_train,new_target,sample_weight=self.weights)
#computed the weighted error which is store in trained_classifier[1]
for point in range(self.N_data) :
if(self.trained_classifier[0].predict([new_train[point]]) != new_target[point]):
self.loss[point] = 1
self.trained_classifier[1] += self.weights[point]

#compute coefficient of classifier i which is store in trained_classifier[2]
self.trained_classifier[2] = 0.5 * np.log((1-self.trained_classifier[1])/self.trained_classifier[1])
#recompute weights
for j in range(self.N_data):
if(self.loss[j] == 1):
self.weights[i][j] *= np.exp(self.trained_classifier[i][2])
else:
self.weights[i][j] *= np.exp(-self.trained_classifier[i][2])

#normalizing the weights
self.trained_classifier[i][1] = self.trained_classifier[i][1] / self.weights[i].sum()

Подробнее здесь: https://stackoverflow.com/questions/418 ... ing-weight

1719532890

Anonymous

Я хочу реализовать базу классификатора adaboost на классификаторе sklearn, на первом этапе классификатора alg я должен инициализировать вес как «1 / # данные поезда»
но это снизит точность классификатора, я не могу понять это почему? (Я установил одинаковые веса для всех точек данных)
МОЙ КОД:
svm_weight = SVC()
svm_non_weight = SVC()

w = np.ones(len(target_train))
w.fill(float(1)/float(len(target_train)))
svm_weight.fit(data_train_feature_scaled_pca,
target_train,
sample_weight= w)

svm_non_weight.fit(data_train_feature_scaled_pca,
target_train)

print "score weight : ",svm_weight.score(data_test_feature_scaled_pca,target_train)
print "score non weight : ",svm_non_weight.score(data_test_feature_scaled_pca,target_train)

ВЫВОД:
score weight :  0.503592561285
score non weight :  0.729289940828

реализован adaboost:
class adaboost_classifier:
def __init__(self,train,target,classifier,n_estimator):
#prepairing dataset
self.N_classes = np.unique(target)
self.n_estimator = n_estimator
self.N_data = len(train)
self.trained_classifier = [[classifier,float(0),float(0), True ] for i in range(n_estimator)]
indice = []
train = np.array(train)
target = np.array(target)
dataset = np.concatenate((train,target),axis=1)
#join train and target for boosting

for i in range(len(dataset[0])-1):
indice.append(i)

self.weights = np.zeros([n_estimator,self.N_data])

# init 1/n value for weights
self.weights.fill(1/float(self.N_data))
#take sampling
new_dataset = dataset
self.N_data = len(new_dataset)
#start training sub classifier
for i in range(n_estimator):
self.loss = np.zeros(self.N_data)
#seprating training and target data
new_train = new_dataset[:,indice]
new_target = new_dataset[:,(len(dataset[0])-1)]
#train the classifier : learn f(X) with data weight
self.trained_classifier[i][0].fit(new_train,new_target,sample_weight=self.weights[i])
#computed the weighted error which is store in trained_classifier[i][1]
for point in range(self.N_data) :
if(self.trained_classifier[i][0].predict([new_train[point]]) != new_target[point]):
self.loss[point] = 1
self.trained_classifier[i][1] += self.weights[i][point]

#compute coefficient of classifier i which is store in trained_classifier[i][2]
self.trained_classifier[i][2] = 0.5 * np.log((1-self.trained_classifier[i][1])/self.trained_classifier[i][1])
#recompute weights
for j in range(self.N_data):
if(self.loss[j] == 1):
self.weights[i][j] *= np.exp(self.trained_classifier[i][2])
else:
self.weights[i][j] *= np.exp(-self.trained_classifier[i][2])

#normalizing the weights
self.trained_classifier[i][1] = self.trained_classifier[i][1] / self.weights[i].sum()
 

Подробнее здесь: [url]https://stackoverflow.com/questions/41804937/decreasing-accuracy-of-scikit-learn-classifier-after-initializing-weight[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Повышение точности обучения при колебаниях точности проверки

Последнее сообщение Anonymous « 10 май 2024, 02:24
Добавлено в форуме Python

Anonymous » 10 май 2024, 02:24 » в форуме Python

Я пытаюсь создать модель распознавания действий на языке жестов, у меня есть кадры, которые я преобразовал в ключевые точки ориентиров с помощью Mediapipe, и они находятся в формате .npy, обучение достигает 90 %, но моя проверка достигает 10 %,...

0 Ответы

60 Просмотры

Последнее сообщение Anonymous
10 май 2024, 02:24
Устранение неисправностей классификатора случайных лесов в Scikit Learn

Последнее сообщение Anonymous « 05 фев 2025, 14:09
Добавлено в форуме Python

Anonymous » 05 фев 2025, 14:09 » в форуме Python

Я пытаюсь запустить классификатор «Случайные леса» от Sci -Kit Learn и получение подозрительно плохого производства - менее 1% прогнозов верны. Модель работает намного хуже, чем шанс. Я относительно новичок в Python, ML и Sci-Kit Learn (тройной...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
05 фев 2025, 14:09
Модель классификатора Scikit-Learn возвращает все нулы

Последнее сообщение Anonymous « 18 июн 2025, 19:22
Добавлено в форуме Python

Anonymous » 18 июн 2025, 19:22 » в форуме Python

Итак, я пытаюсь обучить модель randomforestclassifier. Однако, когда я тренируюсь, это дает мне все нулы. И я действительно не могу понять, почему. Набор данных огромный (ближе к 75 0000 рядам), поэтому я немного потерян. Вот код. :
import pandas...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
18 июн 2025, 19:22
Модель классификатора Scikit-Learn возвращает все нулы

Последнее сообщение Anonymous « 19 июн 2025, 13:43
Добавлено в форуме Python

Anonymous » 19 июн 2025, 13:43 » в форуме Python

Итак, я пытаюсь обучить модель randomforestclassifier. Однако, когда я тренируюсь, это дает мне все нулы. И я действительно не могу понять, почему. Набор данных огромный (ближе к 75 0000 рядам), поэтому я немного потерян. Вот код. :
import pandas...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
19 июн 2025, 13:43
Модель классификатора Scikit-Learn возвращает все нулы

Последнее сообщение Anonymous « 19 июн 2025, 16:52
Добавлено в форуме Python

Anonymous » 19 июн 2025, 16:52 » в форуме Python

Итак, я пытаюсь обучить модель randomforestclassifier. Однако, когда я тренируюсь, это дает мне все нулы. И я действительно не могу понять, почему. Набор данных огромный (ближе к 75 0000 рядам), поэтому я немного потерян. Вот код. :
import pandas...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
19 июн 2025, 16:52

Вернуться в «Python»