Регулярное выражение Python для нескольких критериев разделения

Регулярное выражение Python для нескольких критериев разделения ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Регулярное выражение Python для нескольких критериев разделения

Цитата

Сообщение Anonymous » 19 окт 2024, 23:01

Мне сложно разделить текст в фрагменте кода, который я пишу. Это программное обеспечение сканирует около 3,5 миллионов строк текста в разных форматах.
Я еще как бы прорабатываю все, но строка ниже кажется довольно стандарт в файле:
EXAMPLE_FILE_TEXT ID="20211111.111111 11111"

Я хочу разделить его следующим образом:
EXAMPLE_FILE_TEXT, ID, 20211111.111111 11111

Насколько это возможно, я бы предпочел избегать жесткого кодирования какого-либо определенного текста, который нужно искать, поскольку я все еще анализирую файл и пытаюсь определить все различные переменные. Я попробовал запустить следующий код:
conditioned_line = re.sub(r'(\w+=)(\w+)', r'\1"\2"', input_line)
output = shlex.split(conditioned_line)

Когда я запускаю этот код, я получаю следующий результат:
['EXAMPLE_FILE_TEXT', 'ID=20211111.111111 11111']

Мне удалось успешно разделить каждый элемент, но мне не удалось успешно разделить их все вместе. Я подозреваю, что это можно сделать с помощью регулярного выражения или с помощью регулярного выражения и разделения shlex, но мне бы действительно пригодились некоторые предложения, если у кого-то есть идеи.
В соответствии с просьбой, вот еще один пример некоторого текста в файле, который я сканирую:
EXAMPLE_TEXT TAG="AB-123-ABCD_$B" ABCDE_ABCD="ABCD_A" ABCDEF_ABCDE="ABCDEF_ABCDEF_$A" ABCDEFGH=""

Это следует разделить на следующее:
EXAMPLE_TEXT, TAG, AB-123-ABCD_$B, ABCDE_ABCD, ABCD_A, ABCDEF_ABCDE, ABCDEF_ABCDEF_$A, ABCDEFGH

Подробнее здесь: https://stackoverflow.com/questions/791 ... t-criteria

1729368109

Anonymous

Мне сложно разделить текст в фрагменте кода, который я пишу. Это программное обеспечение сканирует около 3,5 миллионов строк текста в разных форматах.
Я еще как бы прорабатываю все, но строка ниже кажется довольно стандарт в файле:
EXAMPLE_FILE_TEXT ID="20211111.111111 11111"

Я хочу разделить его следующим образом:
EXAMPLE_FILE_TEXT, ID, 20211111.111111 11111

Насколько это возможно, я бы предпочел избегать жесткого кодирования какого-либо определенного текста, который нужно искать, поскольку я все еще анализирую файл и пытаюсь определить все различные переменные. Я попробовал запустить следующий код:
conditioned_line = re.sub(r'(\w+=)(\w+)', r'\1"\2"', input_line)
output = shlex.split(conditioned_line)

Когда я запускаю этот код, я получаю следующий результат:
['EXAMPLE_FILE_TEXT', 'ID=20211111.111111 11111']

Мне удалось успешно разделить каждый элемент, но мне не удалось успешно разделить их все вместе. Я подозреваю, что это можно сделать с помощью регулярного выражения или с помощью регулярного выражения и разделения shlex, но мне бы действительно пригодились некоторые предложения, если у кого-то есть идеи.
В соответствии с просьбой, вот еще один пример некоторого текста в файле, который я сканирую:
EXAMPLE_TEXT TAG="AB-123-ABCD_$B" ABCDE_ABCD="ABCD_A" ABCDEF_ABCDE="ABCDEF_ABCDEF_$A" ABCDEFGH=""

Это следует разделить на следующее:
EXAMPLE_TEXT, TAG, AB-123-ABCD_$B, ABCDE_ABCD, ABCD_A, ABCDEF_ABCDE, ABCDEF_ABCDEF_$A, ABCDEFGH
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79105679/python-regular-expression-for-multiple-split-criteria[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Регулярное выражение Python для нескольких критериев разделения

Последнее сообщение Anonymous « 19 окт 2024, 22:11
Добавлено в форуме Python

Anonymous » 19 окт 2024, 22:11 » в форуме Python

Мне сложно разделить текст в фрагменте кода, который я пишу. Это программное обеспечение сканирует около 3,5 миллионов строк текста в разных форматах.
Я еще как бы прорабатываю все, но строка ниже кажется довольно стандарт в файле:...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
19 окт 2024, 22:11
Регулярное выражение Python для нескольких критериев разделения

Последнее сообщение Anonymous « 19 окт 2024, 23:31
Добавлено в форуме Python

Anonymous » 19 окт 2024, 23:31 » в форуме Python

Мне сложно разделить текст в фрагменте кода, который я пишу. Это программное обеспечение сканирует около 3,5 миллионов строк текста в разных форматах.
Я еще как бы прорабатываю все, но строка ниже кажется довольно стандарт в файле:
EXAMPLE_FILE_TEXT...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
19 окт 2024, 23:31
Регулярное выражение для разделения строки по первому буквенному символу

Последнее сообщение Anonymous « 01 авг 2024, 21:07
Добавлено в форуме Python

Anonymous » 01 авг 2024, 21:07 » в форуме Python

У меня есть строка, которая будет иметь значение где-то вроде
#549382This/ *is a test&

И я хочу удалить #549382 из текста.
Этот вопрос конкретно сработал бы, если бы я знал, какой символ нужно удалить. . Но за этой строкой цифр может следовать...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
01 авг 2024, 21:07
Регулярное выражение для разделения SQL-кода на несколько пакетов.

Последнее сообщение Anonymous « 15 окт 2024, 05:35
Добавлено в форуме JAVA

Anonymous » 15 окт 2024, 05:35 » в форуме JAVA

У нас есть Java-программа, которая используется для передачи произвольного SQL-кода на серверы MS SQL через JDBC.
В более старых версиях входной SQL-код просто разделялся на ;-символ, отправляющий одну часть за раз с использованием ReadedStatement...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 05:35
Регулярное выражение для разделения SQL-кода на несколько пакетов.

Последнее сообщение Anonymous « 15 окт 2024, 07:18
Добавлено в форуме JAVA

Anonymous » 15 окт 2024, 07:18 » в форуме JAVA

У нас есть Java-программа, которая используется для передачи произвольного SQL-кода на серверы MS SQL через JDBC.
В более старых версиях входной SQL-код просто разделялся на ;-символ, отправляющий одну часть за раз с использованием ReadedStatement...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 07:18

Вернуться в «Python»