Мне срочно нужна помощь. Не могу понять, как правильно написать скрипт.
Условие задачи
Дана таблица с различными данными, нужно найти в таблице регулярные выражения \d+\/\d{2}, после чего мне нужно удалить дубликаты.
P.s: Саму таблицу Excel загрузил в power bi (пишу на всякий случай)
ссылка на таблицу данных
https://docs.google.com/spreadsheets/d/ ... ue&sd=true
Я пытался разбить таблицу на пробелы, чтобы как-то упростить код, но ничего не получилось.
Мой сценарий.
импортировать панд как pd импортировать повторно набор данных = dataset.drop_duulates() данные = { 'Комментарий1': [ ], «Комментарий2»: [ ], 'Комментарий3': [ ], «Комментарий4»: [ ], 'Комментарий5': [ ], 'Комментарий6': [ ], 'Комментарий7': [ ], 'Комментарий8': [ ], 'Комментарий9': [ ], «Комментарий10»: [ ], «Комментарий11»: [ ], «Комментарий12»: [ ], «Комментарий13»: [ ], «Комментарий14»: [ ], «Комментарий15»: [ ], } list1 = pd.DataFrame(данные) шаблон = r'\d+\/\d{2}' защита find_pattern(текст): шаблон = r'\d+/\d{2}' совпадения = re.findall(шаблон, текст) return ",".join(соответствует) Скрипт только удаляет дубликаты и больше ничего не делает, это единственный скрипт, который запустился)
Скрипт Python в Power BI (редактор Power Query) ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как создать редактор JavaScript, редактор HTML и редактор CSS в HTML?
Anonymous » » в форуме Android - 0 Ответы
- 51 Просмотры
-
Последнее сообщение Anonymous
-