Используйте scikit-learn для классификации по нескольким категориям

Используйте scikit-learn для классификации по нескольким категориям ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Используйте scikit-learn для классификации по нескольким категориям

Цитата

Сообщение Anonymous » 23 сен 2024, 23:37

Я пытаюсь использовать один из контролируемых методов обучения scikit-learn, чтобы классифицировать фрагменты текста в одну или несколько категорий. Функция прогнозирования всех алгоритмов, которые я пробовал, возвращает только одно совпадение.

Например, у меня есть фрагмент текста:

Код: Выделить всё

"Theaters in New York compared to those in London"

И я обучил алгоритм выбирать место для каждого фрагмента текста, который я ему добавляю.

В В приведенном выше примере я бы хотел, чтобы он возвращал Нью-Йорк и Лондон, но он возвращает только Нью-Йорк.

Возможно ли это использовать scikit-learn для возврата нескольких результатов? Или даже вернуть метку со следующей по величине вероятностью?

Спасибо за помощь.

---Обновление

Я пробовал использовать OneVsRestClassifier, но по-прежнему получаю только один вариант для каждого фрагмента текста. Ниже приведен пример кода, который я использую

Код: Выделить всё

y_train = ('New York','London')

train_set = ("new york nyc big apple", "london uk great britain")
vocab = {'new york' :0,'nyc':1,'big apple':2,'london' : 3, 'uk': 4, 'great britain' : 5}
count = CountVectorizer(analyzer=WordNGramAnalyzer(min_n=1, max_n=2),vocabulary=vocab)
test_set = ('nice day in nyc','london town','hello welcome to the big apple. enjoy it here and london too')

X_vectorized = count.transform(train_set).todense()
smatrix2  = count.transform(test_set).todense()

base_clf = MultinomialNB(alpha=1)

clf = OneVsRestClassifier(base_clf).fit(X_vectorized, y_train)
Y_pred = clf.predict(smatrix2)
print Y_pred

Результат: ['Нью-Йорк' 'Лондон' 'Лондон']

Подробнее здесь: https://stackoverflow.com/questions/105 ... categories

1727123852

Anonymous

Я пытаюсь использовать один из контролируемых методов обучения scikit-learn, чтобы классифицировать фрагменты текста в одну или несколько категорий. Функция прогнозирования всех алгоритмов, которые я пробовал, возвращает только одно совпадение.

Например, у меня есть фрагмент текста:

[code]"Theaters in New York compared to those in London"
[/code]

И я обучил алгоритм выбирать место для каждого фрагмента текста, который я ему добавляю.

В В приведенном выше примере я бы хотел, чтобы он возвращал Нью-Йорк и Лондон, но он возвращает только Нью-Йорк.

Возможно ли это использовать scikit-learn для возврата нескольких результатов? Или даже вернуть метку со следующей по величине вероятностью? 

Спасибо за помощь.

---Обновление 

Я пробовал использовать OneVsRestClassifier, но по-прежнему получаю только один вариант для каждого фрагмента текста. Ниже приведен пример кода, который я использую

[code]y_train = ('New York','London')

train_set = ("new york nyc big apple", "london uk great britain")
vocab = {'new york' :0,'nyc':1,'big apple':2,'london' : 3, 'uk': 4, 'great britain' : 5}
count = CountVectorizer(analyzer=WordNGramAnalyzer(min_n=1, max_n=2),vocabulary=vocab)
test_set = ('nice day in nyc','london town','hello welcome to the big apple. enjoy it here and london too')

X_vectorized = count.transform(train_set).todense()
smatrix2  = count.transform(test_set).todense()

base_clf = MultinomialNB(alpha=1)

clf = OneVsRestClassifier(base_clf).fit(X_vectorized, y_train)
Y_pred = clf.predict(smatrix2)
print Y_pred
[/code]

Результат: ['Нью-Йорк' 'Лондон' 'Лондон'] 

Подробнее здесь: [url]https://stackoverflow.com/questions/10526579/use-scikit-learn-to-classify-into-multiple-categories[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Оптимизация гиперпараметров для повышения точности классификации с использованием набора данных NSL-KDD в scikit-learn

Последнее сообщение Anonymous « 30 окт 2024, 23:16
Добавлено в форуме Python

Anonymous » 30 окт 2024, 23:16 » в форуме Python

Я работаю с набором данных NSL-KDD, и моя задача — повысить точность алгоритмов классификации с помощью scikit-learn. В частности, я заинтересован в достижении показателя точности более 80%.
Я реализовал различные алгоритмы классификации из...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 23:16
Я работаю над задачей классификации, используя Scikit-Learn (LogisticRegression ())

Последнее сообщение Anonymous « 15 июн 2025, 02:41
Добавлено в форуме Python

Anonymous » 15 июн 2025, 02:41 » в форуме Python

Я работаю над задачей классификации, используя Scikit-Learn. После фильтрации и масштабирования моего набора данных я пытаюсь обучить модель логистической регрессии и вычислить матрицу путаницы и оценку F1. Вот код, который я использую:
import...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
15 июн 2025, 02:41
Я работаю над задачей классификации, используя Scikit-Learn (LogisticRegression ())

Последнее сообщение Anonymous « 15 июн 2025, 13:13
Добавлено в форуме Python

Anonymous » 15 июн 2025, 13:13 » в форуме Python

Я работаю над задачей классификации, используя Scikit-Learn. После фильтрации и масштабирования моего набора данных я пытаюсь обучить модель логистической регрессии и вычислить матрицу путаницы и оценку F1. Вот код, который я использую:
import...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
15 июн 2025, 13:13
Я работаю над задачей классификации, используя Scikit-Learn (LogisticRegression ())

Последнее сообщение Anonymous « 15 июн 2025, 17:57
Добавлено в форуме Python

Anonymous » 15 июн 2025, 17:57 » в форуме Python

import pandas as pd
from sklearn.model_selection import train_test_split

from sklearn.preprocessing import MinMaxScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, f1_score

df_filtered = df[(df...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
15 июн 2025, 17:57
Я работаю над задачей классификации, используя Scikit-Learn (LogisticRegression ())

Последнее сообщение Anonymous « 15 июн 2025, 20:28
Добавлено в форуме Python

Anonymous » 15 июн 2025, 20:28 » в форуме Python

import pandas as pd
from sklearn.model_selection import train_test_split

from sklearn.preprocessing import MinMaxScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, f1_score

df_filtered = df[(df...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
15 июн 2025, 20:28

Вернуться в «Python»