Я видел кучу подобных вопросов на SO/в других местах, но ни один из ответов не полностью удовлетворяет мои потребности, поэтому я не думаю, что это обман.
Кроме того, я сам прекрасно знаю, как это реализовать, но стараюсь не изобретать велосипед.
Кто-нибудь знает какие-нибудь пакеты Python, которые Может ли Левенштейн/другое редактирование-расстояние сравнивать 2 списка слов (я нашел несколько), но также позволяет указать собственные затраты на вставку, удаление, замену и транспозицию?
По сути, я хочу, чтобы вычисляемые расстояния определялись количеством правок слов в предложениях, а не количеством символов, которыми отличаются предложения.
Я пытаюсь заменить собственный модуль расширения Python, который на самом деле написан на C, используя API C Python2. Я мог бы переписать код на чистом Python или Cython, но я бы предпочел просто добавить зависимость к проекту. Единственная проблема заключается в том, что этот код позволяет указывать собственные затраты для различных опций, и я пока не нашел пакета, который позволял бы это делать.
Подробнее здесь: https://stackoverflow.com/questions/554 ... istance-at
Ищу библиотеку Python, которая может выполнять расстояние редактирования Левенштейна/другого на уровне слова ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Сходство строк с Python + Sqlite (расстояние Левенштейна/расстояние редактирования)
Anonymous » » в форуме Python - 0 Ответы
- 29 Просмотры
-
Последнее сообщение Anonymous
-