Как хранить и сопоставлять выбранные пользователем слова с их различными формами в тексте? [закрыто]Html

Программисты Html
Ответить
Anonymous
 Как хранить и сопоставлять выбранные пользователем слова с их различными формами в тексте? [закрыто]

Сообщение Anonymous »

Я хочу создать программу, в которой пользователь может вводить любой текст, который хочет изучить.
Во время чтения пользователь может выбирать определенные слова. Каждое выбранное слово должно быть сохранено в словаре или списке.
Позже, когда пользователь прочитает другой текст, программа должна проверить, появляется ли какое-либо из сохраненных слов (или их вариантов) в новом тексте.
Например:
  • Если пользователь выбирает изучение, программа также должна распознавать изучаемое, изучение, изучение и т. д.
  • Цель состоит в том, чтобы напомнить пользователю, что он уже изучал это слово раньше, даже если оно встречается в другой форме.
Мои вопросы:
  • Какова лучшая структура данных для хранения этих слов и их вариантов (словарь, набор, база данных)?
  • Должен ли я полагаться на библиотеки стеммирования/лемматизации (например, NLTK или spaCy в Python), или лучше получать словоформы из API онлайн-словаря?
  • Как эффективно проверять совпадения в больших текстах?
Я еще не решил, какой язык программирования использовать. Будет ли Python, JavaScript или другой язык более подходящим для такой задачи обработки текста?
Любые предложения по архитектуре, библиотекам или алгоритмам будут очень полезны.

Подробнее здесь: https://stackoverflow.com/questions/798 ... across-tex
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»