Очистка текста: удаление дат из текста, где естьPython

Программы на Python
Ответить
Anonymous
 Очистка текста: удаление дат из текста, где есть

Сообщение Anonymous »

Мне нужно будет очистить текст, который может содержать такую ​​последовательность:

Код: Выделить всё

Date            Text
2020-06-01  1 giu 2020 - Per farlo hai messo in atto un pia...
2020-06-01  La trappola del Paragone
2020-06-05  5 giu 2020 - sistema Aegis Ashore? N...
2020-06-05  Lewis Hamilton - «Il silenzio colpevole della F1»

Могут быть тексты, начинающиеся с даты (формат 1 giu 2020, т.е. d m гггг, за которым следует -), и тексты, которые этого не делают.
Я хотел бы знать, как сохранить только часть текста, т.е.

Код: Выделить всё

Date            Text
2020-06-01  Per farlo hai messo in atto un pia...
2020-06-01  La trappola del Paragone
2020-06-05  sistema Aegis Ashore? N...
2020-06-05  Lewis Hamilton - «Il silenzio colpevole della F1»
Я пробовал следующее:

Код: Выделить всё

fil_dataset['Text']=fil_dataset['Text'].str.split(n=4).str[-1]
, но не работает, так как может удалить и часть текста. Возможное решение, предложенное anky в его/ее комментарии ниже, к сожалению, не работает, так как мне также нужно иметь в виду, что может быть -, который не следует за датой, который может удалить некоторый текст.
Спасибо за вашу помощь.>

Подробнее здесь: https://stackoverflow.com/questions/631 ... -there-are
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»