Мне сложно разделить текст в фрагменте кода, который я пишу. Это программное обеспечение сканирует около 3,5 миллионов строк текста в разных форматах.
Я еще как бы прорабатываю все, но строка ниже кажется довольно стандарт в файле:
EXAMPLE_FILE_TEXT ID="20211111.111111 11111"
Я хочу разделить его следующим образом:
EXAMPLE_FILE_TEXT, ID, 20211111.111111 11111
Насколько это возможно, я бы предпочел избегать жесткого кодирования какого-либо определенного текста, который нужно искать, поскольку я все еще анализирую файл и пытаюсь определить все различные переменные. Я попробовал запустить следующий код:
conditioned_line = re.sub(r'(\w+=)(\w+)', r'\1"\2"', input_line)
output = shlex.split(conditioned_line)
Когда я запускаю этот код, я получаю следующий результат:
['EXAMPLE_FILE_TEXT', 'ID=20211111.111111 11111']
Мне удалось успешно разделить каждый элемент, но мне не удалось успешно разделить их все вместе. Я подозреваю, что это можно сделать с помощью регулярного выражения или с помощью регулярного выражения и разделения shlex, но мне бы действительно пригодились некоторые предложения, если у кого-то есть идеи.
В соответствии с просьбой, вот еще один пример некоторого текста в файле, который я сканирую:
EXAMPLE_TEXT TAG="AB-123-ABCD_$B" ABCDE_ABCD="ABCD_A" ABCDEF_ABCDE="ABCDEF_ABCDEF_$A" ABCDEFGH=""
Это следует разделить на следующее:
EXAMPLE_TEXT, TAG, AB-123-ABCD_$B, ABCDE_ABCD, ABCD_A, ABCDEF_ABCDE, ABCDEF_ABCDEF_$A, ABCDEFGH
Подробнее здесь: https://stackoverflow.com/questions/791 ... t-criteria
Регулярное выражение Python для нескольких критериев разделения ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Регулярное выражение для разделения строки по первому буквенному символу
Anonymous » » в форуме Python - 0 Ответы
- 10 Просмотры
-
Последнее сообщение Anonymous
-