Оптимизация построения Trie во Flashtext для больших наборов данных с ключом-значениемPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Оптимизация построения Trie во Flashtext для больших наборов данных с ключом-значением

Сообщение Anonymous »

В настоящее время я столкнулся с проблемой: мне нужно заменить большое количество слов в наборе данных. У меня около 16 миллионов пар слов «ключ-значение». Для замены я использую Flashtext, который работает хорошо. Однако проблема возникает при создании словаря дерева, используемого Flashtext для быстрого поиска. Создание этого словаря для 16 миллионов пар ключ-значение занимает примерно 45 минут.
официальный репозиторий flashtext
Существуют ли более быстрые реализации для создания тройных данных состав? Можно ли это реализовать с помощью параллельной обработки?

Подробнее здесь: https://stackoverflow.com/questions/783 ... e-datasets
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»