Сочетные элементы вокруг сепаратора с использованием Python

Сочетные элементы вокруг сепаратора с использованием Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Сочетные элементы вокруг сепаратора с использованием Python

Цитата

Сообщение Anonymous » 26 май 2025, 21:34

Я относительно неопытен в Python, и я попал в стену, используя ее, чтобы очистить некоторые текстовые данные в полезное формат. Эта функция текста, к счастью, регулярная, но окружающий формат имеет большую изменчивость - на одной строке может быть несколько (имя, значение, значение), может быть дополнительный бесполезный текст в любой конкретной строке (и этот «бесполезный текст» может включать любые символы, а не только алфавитные), может быть целые строки без полезных данных и т. Д.string = 'apples, red .... 0.15 apples, green ... 0.99\nbananas (bunch).......... 0.111\nfruit salad, small........1.35 [unwanted stuff #1.11 here]\nunwanted line here\nfruit salad, large .... 1.77 strawberry ........ 0.66 unwanted 00-11info here'
< /code>
Просто для того, чтобы сделать строку легче для вас, чтобы увидеть на Stackoverflow, это то, на что выглядят «данные» визуально, разделяя новички 
apples, red .... 0.15 apples, green ... 0.99
bananas (bunch).......... 0.111
fruit salad, small........1.35 [unwanted stuff #1.11 here]
unwanted line here
fruit salad, large .... 1.77 strawberry ........ 0.66 unwanted 00-11info here
< /code>
Другая счастливая функция строки заключается в том, что «нежелательный текст» всегда будет следовать за значениями и будет в конце строки. Мне не нужно беспокоиться о том, что нежелательный текст находится рядом с (имя). 
В конце дня я хочу получить 
apples, red | 0.15
apples, green | 0.99
bananas (bunch) | 0.111
fruit salad, small | 1.35
fruit salad, large | 1.77
strawberry | 0.66
< /code>
или что -то подобное, которое можно загрузить в R, Excel и т. Д. Например, я попробовал 
string = 'apples, red .... 0.15 apples, green ... 0.99\nbananas (bunch).......... 0.111\nfruit salad, small........1.35 [unwanted stuff #1.11 here]\nunwanted line here\nfruit salad, large .... 1.77 strawberry ........ 0.66 unwanted 00-11info here'

text = re.split(r"\.{3,}|\n", string)
print(text)
< /code>
, который расщепляется на новую линию или 3+ периода и дает 
['apples, red ', ' 0.15 apples, green ', ' 0.99', 'bananas (bunch)', ' 0.111', 'fruit salad, small', '1.35 [unwanted stuff #1.11 here]', 'unwanted line here', 'fruit salad, large ', ' 1.77 strawberry ', ' 0.66 unwanted 00-11info here']
< /code>
, что близко, но проблемы с этим решением: 
(1) Каждый элемент в списке не является правильной (именем, значением), так как разделение происходит между элементами (имя) и (значение). Например, 0,15 должен быть связан с «яблоками, красными», но вместо этого он делит элемент списка с последующими «яблоками, зелеными». Я, вероятно, мог бы сконструировать некоторую дополнительную постобработку, но я чувствую, что должно быть более элегантное решение, учитывая регулярность строки. То есть, должна быть некоторая режима, которая может искать «алфавитные символы», за которыми следует «3 или более периодов», за которым следует «номер», с любым дополнительным текстом после «числа», выброшенного как бесполезное. Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/796 ... ing-python

1748284493

Anonymous

 Я относительно неопытен в Python, и я попал в стену, используя ее, чтобы очистить некоторые текстовые данные в полезное формат. Эта функция текста, к счастью, регулярная, но окружающий формат имеет большую изменчивость - на одной строке может быть несколько (имя, значение, значение), может быть дополнительный бесполезный текст в любой конкретной строке (и этот «бесполезный текст» может включать любые символы, а не только алфавитные), может быть целые строки без полезных данных и т. Д.string = 'apples, red .... 0.15 apples, green ... 0.99\nbananas (bunch).......... 0.111\nfruit salad, small........1.35 [unwanted stuff #1.11 here]\nunwanted line here\nfruit salad, large .... 1.77 strawberry ........ 0.66 unwanted 00-11info here'
< /code>
Просто для того, чтобы сделать строку легче для вас, чтобы увидеть на Stackoverflow, это то, на что выглядят «данные» визуально, разделяя новички < /p>
apples, red .... 0.15 apples, green ... 0.99
bananas (bunch).......... 0.111
fruit salad, small........1.35 [unwanted stuff #1.11 here]
unwanted line here
fruit salad, large .... 1.77 strawberry ........ 0.66 unwanted 00-11info here
< /code>
Другая счастливая функция строки заключается в том, что «нежелательный текст» всегда будет следовать за значениями и будет в конце строки. Мне не нужно беспокоиться о том, что нежелательный текст находится рядом с (имя). < /P>
В конце дня я хочу получить < /p>
apples, red | 0.15
apples, green | 0.99
bananas (bunch) | 0.111
fruit salad, small | 1.35
fruit salad, large | 1.77
strawberry | 0.66
< /code>
или что -то подобное, которое можно загрузить в R, Excel и т. Д. Например, я попробовал < /p>
string = 'apples, red .... 0.15 apples, green ... 0.99\nbananas (bunch).......... 0.111\nfruit salad, small........1.35 [unwanted stuff #1.11 here]\nunwanted line here\nfruit salad, large .... 1.77 strawberry ........ 0.66 unwanted 00-11info here'

text = re.split(r"\.{3,}|\n", string)
print(text)
< /code>
, который расщепляется на новую линию или 3+ периода и дает < /p>
['apples, red ', ' 0.15 apples, green ', ' 0.99', 'bananas (bunch)', ' 0.111', 'fruit salad, small', '1.35 [unwanted stuff #1.11 here]', 'unwanted line here', 'fruit salad, large ', ' 1.77 strawberry ', ' 0.66 unwanted 00-11info here']
< /code>
, что близко, но проблемы с этим решением: < /p>
(1) Каждый элемент в списке не является правильной (именем, значением), так как разделение происходит между элементами (имя) и (значение). Например, 0,15 должен быть связан с «яблоками, красными», но вместо этого он делит элемент списка с последующими «яблоками, зелеными». Я, вероятно, мог бы сконструировать некоторую дополнительную постобработку, но я чувствую, что должно быть более элегантное решение, учитывая регулярность строки. То есть, должна быть некоторая режима, которая может искать «алфавитные символы», за которыми следует «3 или более периодов», за которым следует «номер», с любым дополнительным текстом после «числа», выброшенного как бесполезное. Спасибо!  

Подробнее здесь: [url]https://stackoverflow.com/questions/79639300/pairing-elements-around-a-separator-using-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Сочетные элементы вокруг сепаратора с использованием Python

Последнее сообщение Anonymous « 26 май 2025, 23:55
Добавлено в форуме Python

Anonymous » 26 май 2025, 23:55 » в форуме Python

Я относительно неопытен в Python, и я попал в стену, используя ее, чтобы очистить некоторые текстовые данные в полезное формат. Эта функция текста, к счастью, регулярная, но окружающий формат имеет большую изменчивость - на одной строке может быть...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
26 май 2025, 23:55
Сочетные элементы вокруг сепаратора с использованием Python

Последнее сообщение Anonymous « 27 май 2025, 21:06
Добавлено в форуме Python

Anonymous » 27 май 2025, 21:06 » в форуме Python

Я относительно неопытен в Python, и я попал в стену, используя ее, чтобы очистить некоторые текстовые данные в полезное формат. Эта функция текста, к счастью, регулярная, но окружающий формат имеет большую изменчивость - на одной строке может быть...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
27 май 2025, 21:06
Как добавить тысячи сепаратора к числу в JavaScript / Python / Django

Последнее сообщение Anonymous « 28 янв 2025, 16:33
Добавлено в форуме Python

Anonymous » 28 янв 2025, 16:33 » в форуме Python

Я хотел спросить, как добавить тысячи сепаратора к номеру, когда я набираю число, а также на выход.

Например, 10 000 становится 10 000.

Я пытался использовать Django Intcomma, но это не работает. Ниже мой код:

html

{{...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
28 янв 2025, 16:33
Добавить в общей сложности тысячи сепаратора с JavaScript или jQuery?

Последнее сообщение Anonymous « 28 янв 2025, 16:02
Добавлено в форуме Jquery

Anonymous » 28 янв 2025, 16:02 » в форуме Jquery

У меня есть функция, которая суммирует столбец данных в таблице HTML. Это превосходно, только я хотел бы, чтобы они поставили запятые туда, которые необходимы для разделения тысяч. Первоначально, вы заметите, что в добавленных цифрах есть запятые....

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
28 янв 2025, 16:02
Как удалить линию сепаратора разметки в README с HTML/CSS?

Последнее сообщение Anonymous « 10 фев 2025, 15:04
Добавлено в форуме Html

Anonymous » 10 фев 2025, 15:04 » в форуме Html

Просто у вас есть вопрос о сепараторах на Readme's на GitHub. У меня есть мой readme здесь, если кто-то хочет проверить это:
Я пытаюсь Удалите линию сепаратора ниже «Bonk Bot» и выше ссылки LinkedIn. Я попытался сделать трюк с двумя пространствами,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
10 фев 2025, 15:04

Вернуться в «Python»