Как хранить и сопоставлять выбранные пользователем слова с их различными формами в тексте?Html

Программисты Html
Ответить
Anonymous
 Как хранить и сопоставлять выбранные пользователем слова с их различными формами в тексте?

Сообщение Anonymous »

Тело:
Я хочу создать программу, в которой пользователь может вводить любой текст, который хочет изучить.
Во время чтения пользователь может выбирать определенные слова. Каждое выбранное слово должно быть сохранено в словаре или списке.
Позже, когда пользователь читает другой текст, программа должна проверить, появляется ли какое-либо из сохраненных слов (или их вариантов) в новом тексте. Например:
- Если пользователь выбирает учеба, программа также должна распознавать учеба, учеба, учеба и т. д.
- Цель состоит в том, чтобы напомнить пользователю, что он уже изучал это слово раньше, даже если оно встречается в другой форме.
Мои вопросы:
1. Какая структура данных лучше всего подходит для хранения этих слов и их вариантов (словарь, набор, база данных)?
2. Стоит ли мне полагаться на библиотеки стемминга/лемматизации (например, NLTK или spaCy в Python) или лучше получать словоформы из API онлайн-словаря?
3. Как эффективно проверять совпадения в больших текстах?
Я еще не решил, какой язык программирования использовать. Будет ли Python, JavaScript или другой язык более подходящим для такой задачи обработки текста?
Любые предложения по архитектуре, библиотекам или алгоритмам будут очень полезны.

Подробнее здесь: https://stackoverflow.com/questions/798 ... across-tex
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»