Самый эффективный способ извлечения ключевых слов

Самый эффективный способ извлечения ключевых слов ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Самый эффективный способ извлечения ключевых слов

Цитата

Сообщение Anonymous » 10 окт 2024, 20:14

Мне нужно обработать тонну (тысячи, возможно, более 100 тысяч) тезисов (текст, содержащий более 1000 слов), и я пытаюсь выполнить массовое извлечение ключевых слов из каждого тезиса. Тезисы хранятся в базе данных вместе с множеством других данных об авторе, которые мне также нужны. В настоящее время я запрашиваю базу данных и составляю файл рассола из всех рефератов в виде списка словарей. Извлечение ключевых слов происходит в режиме реального времени, то есть пользователь создает список ключевых слов/фраз, а затем запускает поиск ключевых слов в файле рассола. Я добился наилучшей производительности при использовании этого метода вместо оперативного запроса базы данных. Тем не менее, этот живой процесс занимает много времени, в зависимости от минуты или двух. Кроме того, все это делается на моем личном рабочем компьютере, поэтому я предполагаю, что на производственных серверах все ускорится. Также для извлечения я использую пакет Flashtext. Кроме того, НЕ используйте панд, просто старый словарь и списки. Кроме того, в качестве базы данных используется MS sql.
Мой вопрос... есть ли способ ускорить это или это просто особенность текстового поиска, медленный?

Подробнее здесь: https://stackoverflow.com/questions/790 ... rd-extract

1728580481

Anonymous

Подробнее здесь: [url]https://stackoverflow.com/questions/79075510/most-efficient-way-to-keyword-extract[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Самый эффективный способ извлечения ключевых слов

Последнее сообщение Anonymous « 15 окт 2024, 22:39
Добавлено в форуме Python

Anonymous » 15 окт 2024, 22:39 » в форуме Python

Мне нужно обработать тонну (тысячи, возможно, более 100 тысяч) тезисов (текст, содержащий более 1000 слов), и я пытаюсь выполнить массовое извлечение ключевых слов из каждого тезиса. Тезисы хранятся в базе данных вместе с множеством других данных об...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 22:39
НЛП — точность алгоритма извлечения ключевых слов

Последнее сообщение Anonymous « 05 ноя 2024, 18:34
Добавлено в форуме Python

Anonymous » 05 ноя 2024, 18:34 » в форуме Python

Я исследовал такие модели НЛП, как Rake, Keybert, Spacy и т. д. Передо мной стоит задача — выполнить простое извлечение ключевых слов, с которым у таких моделей, как Rake и Keybert, нет проблем. Но я видел такие продукты, как NeuronWriter и...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 18:34
НЛП — точность алгоритма извлечения ключевых слов [закрыто]

Последнее сообщение Anonymous « 06 ноя 2024, 01:14
Добавлено в форуме Python

Anonymous » 06 ноя 2024, 01:14 » в форуме Python

Я исследовал такие модели НЛП, как Rake, Keybert, Spacy и т. д. Передо мной стоит задача — выполнить простое извлечение ключевых слов, с которым у таких моделей, как Rake и Keybert, нет проблем. Но я видел такие продукты, как NeuronWriter и...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
06 ноя 2024, 01:14
Как наиболее эффективный способ вычислять количество слов для 4M записей и список слов, содержащий 1 и 2 грамма?

Последнее сообщение Anonymous « 27 май 2025, 14:40
Добавлено в форуме Python

Anonymous » 27 май 2025, 14:40 » в форуме Python

Вот моя проблема. У меня очень большой файл с примерно 4 -метровыми рядами, где в каждом строке есть что -то вроде абзаца текста. Тогда у меня есть список слов с около 150 терминов, некоторые из них-1 грамма, а некоторые-2 грамма. Мне нужно сделать...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
27 май 2025, 14:40
Как наиболее эффективный способ вычислять количество слов для 4M записей и список слов, содержащий 1 и 2 грамма?

Последнее сообщение Anonymous « 27 май 2025, 17:04
Добавлено в форуме Python

Anonymous » 27 май 2025, 17:04 » в форуме Python

Вот моя проблема. У меня очень большой файл с примерно 4 -метровыми рядами, где в каждом строке есть что -то вроде абзаца текста. Тогда у меня есть список слов с около 150 терминов, некоторые из них-1 грамма, а некоторые-2 грамма. Мне нужно сделать...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
27 май 2025, 17:04

Вернуться в «Python»