Извлечение только технических ключевых слов из текста с использованием библиотеки RAKE в PythonPython

Программы на Python
Ответить Пред. темаСлед. тема
Гость
 Извлечение только технических ключевых слов из текста с использованием библиотеки RAKE в Python

Сообщение Гость »

Я хочу использовать rake для извлечения технических ключевых слов из описания вакансии, которое я нашел в Linkedin и которое выглядит следующим образом:

Код: Выделить всё

input = "In-depth understanding of the Python software development stacks, ecosystems, frameworks and tools such as Numpy, Scipy, Pandas, Dask, spaCy, NLTK, sci-kit-learn and PyTorch.Experience with front-end development using HTML, CSS, and JavaScript.
Familiarity with database technologies such as SQL and NoSQL.Excellent problem-solving ability with solid communication and collaboration skills.
Preferred Skills And QualificationsExperience with popular Python frameworks such as Django, Flask or Pyramid."
Я запускаю этот код, поскольку он должен возвращать ключевые слова.

Код: Выделить всё

from rake_nltk import Rake

r = Rake()
r.extract_keywords_from_text(input)
keywords = r.get_ranked_phrases_with_scores()

for score, keyword in keywords:
if len(keyword.split()) == 1:  # Check if the keyword is one word
print(f"{keyword}: {score}")
Но результат такой:

Код: Выделить всё

frameworks: 2.0
tools: 1.0
sql: 1.0
spacy: 1.0
scipy: 1.0
sci: 1.0
qualificationsexperience: 1.0
pytorch: 1.0
pyramid: 1.0
pandas: 1.0
numpy: 1.0
nosql: 1.0
nltk: 1.0
learn: 1.0
kit: 1.0
javascript: 1.0
front: 1.0
flask: 1.0
familiarity: 1.0
experience: 1.0
ecosystems: 1.0
django: 1.0
dask: 1.0
css: 1.0
Просто мне нужно явное название инструментов, навыков и фреймворков. Например, «Numpy», «Scipy», «HTML» и т. д. Они используются в тексте, а НЕ каждое слово, встречающееся в нем (например, «опыт» или «инструменты»).
Есть ли какой-нибудь способ это сделать? Или мне следует просто предоставить список всех возможных фреймворков Python и связанных с ними навыков, а затем отфильтровать вывод rake?
Если последнее является решением, как мне найти/составить подробный список?Любая помощь приветствуется.

Подробнее здесь: https://stackoverflow.com/questions/783 ... -in-python
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»