Моя задача - разделить строку, которая не имеет места на отдельные слова. Например:
"Программное соглашение" -> "Соглашение о программе"
"Drivername" -> "Имя драйвера"
Для этих целей я использую библиотеку wordninja , и в большинстве случаев я получаю приемлемый результат. Тем не менее, есть проблемы: если строка содержит особые символы, Wordninja игнорирует их, что неприемлемо для меня. Вот несколько примеров: < /p>
'addressbelow:' -> 'Адрес ниже' < /p>
"Страницы#номер" -> "Номер страниц" < /p>
Однако, как вы, вероятно, уже охватывали, я хотел бы сохранить специальные символы. То есть, я хотел бы увидеть следующий результат: < /p>
'Addressbelow:' -> 'Адрес ниже:' < /p>
"Страницы# №" -> "Pages# №" < /p>
В этот момент действительно простой < /p>
< /p>
мой код в этот момент действительно просто < /p>
< /p>
.import wordninja
separate_words = " ".join(wordninja.split("PAGES#NUMBER"))
Подробнее здесь: https://stackoverflow.com/questions/794 ... characters
Разделите строку на отдельные слова без пробелов, сохраняя специальные символы [закрыто] ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Разделите строку на отдельные слова без пробелов, сохраняя специальные символы
Anonymous » » в форуме Python - 0 Ответы
- 4 Просмотры
-
Последнее сообщение Anonymous
-