Разделить столбец данных pandas на несколько на основе текстовых значенийPython

Программы на Python
Ответить
Anonymous
 Разделить столбец данных pandas на несколько на основе текстовых значений

Сообщение Anonymous »

У меня есть фрейм данных pandas со столбцом.
id text_col
1 Was it Accurate?: Yes\n\nReasoning: This is a sample : text
2 Was it Accurate?: Yes\n\nReasoning: This is a :sample 2 text
3 Was it Accurate?: No\n\nReasoning: This is a sample: 1. text

Мне нужно разбить text_col на два столбца «Было ли это точно?» и «Рассуждение»
Окончательный фрейм данных должен выглядеть так:
id Was it Accurate? Reasoning
1 Yes This is a sample : text
2 Yes This is a :sample 2 text
3 No This is a sample: 1. text

Текстовые значения могут содержать несколько : "двоеточий"
Я попробовал разделить text_col с помощью "\n\nReasoning:", но не получил желаемого результата. Текст после второго двоеточия (:) остается без внимания
df[['Was it Accurate?', 'Reasoning']] = df['text_col'].str.extract(r'Was it Accurate\?: (Yes|No)\n\nReasoning: (.*)')
Изменить:
Изображение

Я применил эту функцию к столбцу LLM_response моего фрейма данных sample_100. и напечатал первую строку. если вы внимательно видите, sample_100.iloc[0]['Reasoning'] удалил весь текст после:
Объект Temp dict для проверки:
{'id_no': [8736215],
'Notes': [' Temp Notes Sample xxxxxxxxxxxxx [4/21/23, 2:10 PM] Work started -work complete-'],
'ProblemDescription': ['Sample problem description xxxxxxxxxxxxxxxxxxxxxxxx'],
'LLM_response': ['Accurate & Understandable: Yes\n\nReasoning: The Technician notes are accurate and understandable as:\n1) The technician provided detailed steps on how they addressed the mold issue by removing materials, treating surfaces, priming, and painting them.\n2) Additionally, even though there was non-repair related information (toilet repairs), the main issue of mold growth was addressed.\n3) The process described logically follows the process for remedying a mold issue, which aligns with the problem description.'],
'Accurate & Understandable': ['Yes'],
'Reasoning': ['The Technician notes are accurate and understandable as:']}


Подробнее здесь: https://stackoverflow.com/questions/787 ... ext-values
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»