Лемма о пунктуации в пространствеPython

Программы на Python
Ответить
Anonymous
 Лемма о пунктуации в пространстве

Сообщение Anonymous »

Я использую пробел для некоторых последующих задач, в основном для извлечения существительных фраз. В моих текстах много скобок, и, применяя лемму, я заметил, что все знаки препинания, не завершающие предложения, становятся --:

Код: Выделить всё

import spacy

nlp = spacy.load("de_core_news_sm")
doc = nlp("(Das ist ein Test!)")
for token in doc:
print(f"Text: '{token.text}', Lemma: '{token.lemma_}'")
Выход:

Код: Выделить всё

Text: '(', Lemma: '--'
Text: 'Das', Lemma: 'der'
Text: 'ist', Lemma: 'sein'
Text: 'ein', Lemma: 'ein'
Text: 'Test', Lemma: 'Test'
Text: '!', Lemma: '--'
Text: ')', Lemma: '--'
Это нормально, и если да, то почему и что я могу сделать, чтобы скобки сохранились?
Я использую версию 3.7.4 с Питон 3.11

Подробнее здесь: https://stackoverflow.com/questions/793 ... n-in-spacy
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»