Используйте scikit-learn для классификации по нескольким категориямPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Используйте scikit-learn для классификации по нескольким категориям

Сообщение Anonymous »

Я пытаюсь использовать один из контролируемых методов обучения scikit-learn, чтобы классифицировать фрагменты текста в одну или несколько категорий. Функция прогнозирования всех алгоритмов, которые я пробовал, возвращает только одно совпадение.

Например, у меня есть фрагмент текста:

Код: Выделить всё

"Theaters in New York compared to those in London"
И я обучил алгоритм выбирать место для каждого фрагмента текста, который я ему добавляю.

В В приведенном выше примере я бы хотел, чтобы он возвращал Нью-Йорк и Лондон, но он возвращает только Нью-Йорк.

Возможно ли это использовать scikit-learn для возврата нескольких результатов? Или даже вернуть метку со следующей по величине вероятностью?

Спасибо за помощь.

---Обновление

Я пробовал использовать OneVsRestClassifier, но по-прежнему получаю только один вариант для каждого фрагмента текста. Ниже приведен пример кода, который я использую

Код: Выделить всё

y_train = ('New York','London')

train_set = ("new york nyc big apple", "london uk great britain")
vocab = {'new york' :0,'nyc':1,'big apple':2,'london' : 3, 'uk': 4, 'great britain' : 5}
count = CountVectorizer(analyzer=WordNGramAnalyzer(min_n=1, max_n=2),vocabulary=vocab)
test_set = ('nice day in nyc','london town','hello welcome to the big apple. enjoy it here and london too')

X_vectorized = count.transform(train_set).todense()
smatrix2  = count.transform(test_set).todense()

base_clf = MultinomialNB(alpha=1)

clf = OneVsRestClassifier(base_clf).fit(X_vectorized, y_train)
Y_pred = clf.predict(smatrix2)
print Y_pred
Результат: ['Нью-Йорк' 'Лондон' 'Лондон']

Подробнее здесь: https://stackoverflow.com/questions/105 ... categories
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»