Я хочу удалить бессмысленные слова в моем наборе данных.import nltk
words = set(nltk.corpus.words.words())
sent = "Io andiamo to the beach with my amico."
" ".join(w for w in nltk.wordpunct_tokenize(sent) \
if w.lower() in words or not w.isalpha())
< /code>
Но теперь, поскольку у меня есть DataFrame, как я могу его перевернуть по всему столбцу.import nltk
words = set(nltk.corpus.words.words())
sent = df['Chats']
df['Chats'] = df['Chats'].apply(lambda w:" ".join(w for w in
nltk.wordpunct_tokenize(sent) \
if w.lower() in words or not w.isalpha()))
< /code>
Но я получаю ошибку TypeError: ожидаемая строка или байт-подобный объект < /p>
Подробнее здесь: https://stackoverflow.com/questions/527 ... -in-python
Удаление бессмысленных слов в Python ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Создать массив уникальных фраз из последовательных слов, сгруппированных по количеству слов.
Anonymous » » в форуме Php - 0 Ответы
- 107 Просмотры
-
Последнее сообщение Anonymous
-