Как безопасно разбирать сложные строки значений SQL на столбцы

Как безопасно разбирать сложные строки значений SQL на столбцы ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как безопасно разбирать сложные строки значений SQL на столбцы

Цитата

Сообщение Anonymous » 15 ноя 2024, 11:57

Я работаю со строкой, которая представляет значения параметров SQL, и мне нужно разобрать ее на отдельные столбцы. Вот пример такой строки:

Код: Выделить всё

values = "( 14587, '290\'960', 'This is, a, difficult,,, string that uses '' \" and even '' \" , '' '', ''. So it definitely needs to be checked for escape characters.', null )"

Цель — извлечь эти значения в список столбцов, решая различные задачи:

Разные Типы данных: значения могут быть целыми числами, строками или нулями.
Escape-символы: строки могут содержать экранированные одинарные кавычки (''),
обратная косая черта или другие специальные символы.
Встроенные разделители: запятые
могут появляться внутри строк, что упрощает разделение по запятые
невозможны.
Сопоставление кавычек. Очень важно правильно сопоставить одинарные кавычки вокруг
строк.

Я попытался использовать регулярное выражение для разделения запятыми вне кавычек:

Код: Выделить всё

import re

values = "( 14587, '290\'960', 'This is, a, difficult,,, string that uses '' \" and even '' \" , '' '', ''. So it definitely needs to be checked for escape characters.', null )"

# Remove outer parentheses and leading/trailing spaces
cleaned_values = values.strip().strip('()')

# Use regular expression to split by commas outside quotes, accounting for escaped quotes
values_list = re.split(r",(?=(?:[^']*'[^']*')*[^']*$)", cleaned_values)

# Strip whitespace from each part
values_list = [v.strip() for v in values_list]

print(cleaned_values)
for value in values_list:
print(value)

Этот подход в некоторой степени работает, но кажется хрупким и может не обрабатывать все крайние случаи, особенно более сложные строки SQL.
Вопрос:
Каков наилучший и наиболее надежный способ анализа таких строк SQL VALUES в отдельные столбцы, гарантируя следующее:

Правильную обработку различных типов данных.
Экранирование и анализ специальных символов правильно.
Сохранение целостности строк со встроенными запятыми или кавычками.

Нужно ли использовать специальный синтаксический анализатор SQL или другой метод будет более подходящим, чем регулярные выражения?

Подробнее здесь: https://stackoverflow.com/questions/791 ... mns-safely

1731661020

Anonymous

Я работаю со строкой, которая представляет значения параметров SQL, и мне нужно разобрать ее на отдельные столбцы. Вот пример такой строки:
[code]values = "( 14587, '290\'960', 'This is, a, difficult,,, string that uses '' \" and even '' \" , '' '', ''. So it definitely needs to be checked for escape characters.', null )"

[/code]
Цель — извлечь эти значения в список столбцов, решая различные задачи:
[list]
[*]Разные Типы данных: значения могут быть целыми числами, строками или нулями.

[*]Escape-символы: строки могут содержать экранированные одинарные кавычки (''),
обратная косая черта или другие специальные символы.

[*]Встроенные разделители: запятые
могут появляться внутри строк, что упрощает разделение по запятые
невозможны.

[*]Сопоставление кавычек. Очень важно правильно сопоставить одинарные кавычки вокруг
строк.
[/list]
Я попытался использовать регулярное выражение для разделения запятыми вне кавычек:
[code]import re

values = "( 14587, '290\'960', 'This is, a, difficult,,, string that uses '' \" and even '' \" , '' '', ''. So it definitely needs to be checked for escape characters.', null )"

# Remove outer parentheses and leading/trailing spaces
cleaned_values = values.strip().strip('()')

# Use regular expression to split by commas outside quotes, accounting for escaped quotes
values_list = re.split(r",(?=(?:[^']*'[^']*')*[^']*$)", cleaned_values)

# Strip whitespace from each part
values_list = [v.strip() for v in values_list]

print(cleaned_values)
for value in values_list:
print(value)
[/code]
Этот подход в некоторой степени работает, но кажется хрупким и может не обрабатывать все крайние случаи, особенно более сложные строки SQL.
Вопрос:
Каков наилучший и наиболее надежный способ анализа таких строк SQL VALUES в отдельные столбцы, гарантируя следующее:
[list]
[*]Правильную обработку различных типов данных.
Экранирование и анализ специальных символов правильно.
[*]Сохранение целостности строк со встроенными запятыми или кавычками.
[/list]
Нужно ли использовать специальный синтаксический анализатор SQL или другой метод будет более подходящим, чем регулярные выражения? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79191561/how-to-parse-complex-sql-values-string-into-columns-safely[/url]