ValueError: недостаточно значений для распаковки (ожидалось 3, получено 2) при извлечении данных с помощью zip() в Panda

ValueError: недостаточно значений для распаковки (ожидалось 3, получено 2) при извлечении данных с помощью zip() в Panda ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

ValueError: недостаточно значений для распаковки (ожидалось 3, получено 2) при извлечении данных с помощью zip() в Panda

Цитата

Сообщение Anonymous » 26 окт 2024, 23:58

Я пытаюсь очистить и упорядочить данные из файла CSV с помощью Python и Pandas. В частности, я хочу извлечь структурированную информацию (например, номера социального страхования, дату рождения и родственные связи) из столбца «Примечания» моего DataFrame. Однако я продолжаю сталкиваться с этой ошибкой:

Код: Выделить всё

PS C:\Users\hokop\Documents\GitHub\Tina-Agency-of-Texas-Data> python test2.py
Traceback (most recent call last):
File "C:\Users\hokop\Documents\GitHub\Tina-Agency-of-Texas-Data\test2.py", line 80, in 
df['SSN'],df['DOB'],df['Relationship'] = zip(*df['Notes'].apply(extract_info))
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
ValueError: not enough values to unpack (expected 3, got 2)

Я уверен, что моя функция extract_info возвращает три значения (SSN, DOB, Relationship). Когда я печатаю вывод внутри функции, все три переменные присутствуют. Вот упрощенная версия моего кода:

Код: Выделить всё

import re
import pandas as pd

# Sample input data
df = pd.read_csv('contacts.csv')

# Define regex patterns for DOB and SSN
dob_pattern = r'\b(?:DOB:|DOB;|DOB: |DOB;)\s*:? ?([0-9]{2}/[0-9]{2}/[0-9]{4})\b'
ssn_pattern = r'\b(?:SS|SS |SS#|SS:|SS: |SS;|SS; |SS# |SS#:|SS#: )\s*:? ?([0-9]{3}-[0-9]{2}-[0-9]{4}|[0-9]{9})\b'
name_pattern3 = r'(?P[A-Za-z]+)(?:\s+(?P[A-Za-z]+))?\s+(?P[A-Za-z]+)'
name_pattern2 = r'(?P[A-Za-z\'-]+)\s+(?P[A-Za-z\'-]+)'

# Define a list of relationship keywords
relationship_keywords = [
"father",
"mother",
"brother",
"sister",
"friend",
"spouse",
"partner",
"child",
"aunt",
"uncle",
"cousin"
]

# Compile a regex pattern for the relationships
relationship_pattern = r'\b(?:' + '|'.join(relationship_keywords) + r')\b'

# Function to extract structured information
def extract_info(entry):
if not isinstance(entry, str):  # Check if the entry is a string
return '',''  # Return empty values for non-strings

# Initialize variables
name = ""
dob = ""
ssn = ""
relationship = "asd"

# Split entry into lines
lines = entry.splitlines()
for line in lines:
line = line.strip()

# if re.match(relationship_pattern, line):
#     relationship = re.search(relationship_pattern, line).group(1)

#     if re.match(name_pattern3, line):
#         name = re.search(name_pattern3, line).group(1)
#     if re.match(name_pattern2, line):
#         name = re.search(name_pattern2, line).group(1)
# elif not relationship:
#     relationship = 'asd'
if re.match(name_pattern3, line):

name = re.search(name_pattern3, line).group(1)
elif re.match(name_pattern2, line):
name = re.search(name_pattern2, line).group(1)
elif re.match(ssn_pattern, line):
# Extract SSN
ssn = re.search(ssn_pattern, line).group(1)
elif re.match(dob_pattern, line):
# Extract DOB
dob = re.search(dob_pattern, line).group(1)
else:
# Assume the remaining line is the name
if line.strip() != '':
name = line
else:
name = ''
relationship = "asd"

return ssn, dob, relationship
# Process each entry and create a list of dictionaries

df['SSN'],df['DOB'],df['Relationship'] = zip(*df['Notes'].apply(extract_info))

# Convert structured data to a DataFrame for better visualization
df.to_csv('ssn.csv', index=False)

# Display the DataFrame
print(df)

Я ожидаю, что функция extract_info вернет кортеж из трех значений, который необходимо распаковать в три новых столбца (SSN, DOB, Relationship). Но ошибка предполагает, что иногда возвращаются только два значения.
Вот несколько подробностей о моей настройке:
Я использую регулярное выражение для извлечения определенные шаблоны.
Если запись не соответствует ожидаемым шаблонам, я хочу, чтобы соответствующие значения по умолчанию были пустыми строками.
Что может быть причиной того, что функция в некоторых случаях возвращает только два значения вместо трех ? Будем очень признательны за любые советы о том, как отладить или исправить эту проблему!

Подробнее здесь: https://stackoverflow.com/questions/791 ... cting-data

1729976308

Anonymous

Я пытаюсь очистить и упорядочить данные из файла CSV с помощью Python и Pandas. В частности, я хочу извлечь структурированную информацию (например, номера социального страхования, дату рождения и родственные связи) из столбца «Примечания» моего DataFrame. Однако я продолжаю сталкиваться с этой ошибкой:
[code]PS C:\Users\hokop\Documents\GitHub\Tina-Agency-of-Texas-Data> python test2.py
Traceback (most recent call last):
File "C:\Users\hokop\Documents\GitHub\Tina-Agency-of-Texas-Data\test2.py", line 80, in 
df['SSN'],df['DOB'],df['Relationship'] = zip(*df['Notes'].apply(extract_info))
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
ValueError: not enough values to unpack (expected 3, got 2)
[/code]
Я уверен, что моя функция extract_info возвращает три значения (SSN, DOB, Relationship). Когда я печатаю вывод внутри функции, все три переменные присутствуют. Вот упрощенная версия моего кода:
[code]import re
import pandas as pd

# Sample input data
df = pd.read_csv('contacts.csv')

# Define regex patterns for DOB and SSN
dob_pattern = r'\b(?:DOB:|DOB;|DOB: |DOB;)\s*:? ?([0-9]{2}/[0-9]{2}/[0-9]{4})\b'
ssn_pattern = r'\b(?:SS|SS |SS#|SS:|SS: |SS;|SS; |SS# |SS#:|SS#: )\s*:? ?([0-9]{3}-[0-9]{2}-[0-9]{4}|[0-9]{9})\b'
name_pattern3 = r'(?P[A-Za-z]+)(?:\s+(?P[A-Za-z]+))?\s+(?P[A-Za-z]+)'
name_pattern2 = r'(?P[A-Za-z\'-]+)\s+(?P[A-Za-z\'-]+)'

# Define a list of relationship keywords
relationship_keywords = [
"father",
"mother",
"brother",
"sister",
"friend",
"spouse",
"partner",
"child",
"aunt",
"uncle",
"cousin"
]

# Compile a regex pattern for the relationships
relationship_pattern = r'\b(?:' + '|'.join(relationship_keywords) + r')\b'

# Function to extract structured information
def extract_info(entry):
if not isinstance(entry, str):  # Check if the entry is a string
return '',''  # Return empty values for non-strings

# Initialize variables
name = ""
dob = ""
ssn = ""
relationship = "asd"

# Split entry into lines
lines = entry.splitlines()
for line in lines:
line = line.strip()

# if re.match(relationship_pattern, line):
#     relationship = re.search(relationship_pattern, line).group(1)

#     if re.match(name_pattern3, line):
#         name = re.search(name_pattern3, line).group(1)
#     if re.match(name_pattern2, line):
#         name = re.search(name_pattern2, line).group(1)
# elif not relationship:
#     relationship = 'asd'
if re.match(name_pattern3, line):

name = re.search(name_pattern3, line).group(1)
elif re.match(name_pattern2, line):
name = re.search(name_pattern2, line).group(1)
elif re.match(ssn_pattern, line):
# Extract SSN
ssn = re.search(ssn_pattern, line).group(1)
elif re.match(dob_pattern, line):
# Extract DOB
dob = re.search(dob_pattern, line).group(1)
else:
# Assume the remaining line is the name
if line.strip() != '':
name = line
else:
name = ''
relationship = "asd"

return ssn, dob, relationship
# Process each entry and create a list of dictionaries

df['SSN'],df['DOB'],df['Relationship'] = zip(*df['Notes'].apply(extract_info))

# Convert structured data to a DataFrame for better visualization
df.to_csv('ssn.csv', index=False)

# Display the DataFrame
print(df)
[/code]
Я ожидаю, что функция extract_info вернет кортеж из трех значений, который необходимо распаковать в три новых столбца (SSN, DOB, Relationship). Но ошибка предполагает, что иногда возвращаются только два значения.
Вот несколько подробностей о моей настройке:
Я использую регулярное выражение для извлечения определенные шаблоны.
Если запись не соответствует ожидаемым шаблонам, я хочу, чтобы соответствующие значения по умолчанию были пустыми строками.
Что может быть причиной того, что функция в некоторых случаях возвращает только два значения вместо трех ? Будем очень признательны за любые советы о том, как отладить или исправить эту проблему! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79129450/valueerror-not-enough-values-to-unpack-expected-3-got-2-when-extracting-data[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

ValueError: недостаточно значений для распаковки (ожидалось 2, получено 1) при запуске тестов Django

Последнее сообщение Anonymous « 26 апр 2024, 08:41
Добавлено в форуме Python

Anonymous » 26 апр 2024, 08:41 » в форуме Python

Тест Django выдает ошибку значения каждый раз, когда я пытаюсь ввести данные в тестовый запрос
req_body = { Value1 : Value1 , Value2 : Value2 }
request = self.client.get(self.getSingleData_url, data= json.dumps(req_body),...

0 Ответы

59 Просмотры

Последнее сообщение Anonymous
26 апр 2024, 08:41
Получите ошибку «недостаточно значений для распаковки (ожидалось 2, получено 0)» при использовании Django EAV 2.

Последнее сообщение Anonymous « 19 ноя 2024, 08:39
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 08:39 » в форуме Python

from django.contrib import admin

from .models import Product

from eav.forms import BaseDynamicEntityForm

from eav.admin import BaseEntityAdmin

Register your models here.

class ProductAdminForm(BaseDynamicEntityForm):
model = Product

class...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 08:39
При сканировании изображения недостаточно значений для распаковки (ожидалось 4, получено 2)

Последнее сообщение Anonymous « 19 янв 2025, 03:01
Добавлено в форуме Python

Anonymous » 19 янв 2025, 03:01 » в форуме Python

Я не мог понять, где и в чем проблема. Я убедился, что возвращаю только два значения (заголовок и заголовок), но не уверен, откуда берутся остальные два значения.
вот моя функция для модели изображения:
def generate_caption_and_title(image_path,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
19 янв 2025, 03:01
При сканировании изображения недостаточно значений для распаковки (ожидалось 4, получено 2)

Последнее сообщение Anonymous « 19 янв 2025, 12:15
Добавлено в форуме Python

Anonymous » 19 янв 2025, 12:15 » в форуме Python

Я не мог понять, где и в чем проблема. Я убедился, что возвращаю только два значения (заголовок и заголовок), но не уверен, откуда берутся остальные два значения.
вот моя функция для модели изображения:
def generate_caption_and_title(image_path,...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
19 янв 2025, 12:15
Недостаточно значений для распаковки (ожидалось 4, получено 2) Python

Последнее сообщение Anonymous « 18 янв 2025, 20:19
Добавлено в форуме Python

Anonymous » 18 янв 2025, 20:19 » в форуме Python

Вчера вечером я пытался устранить эту неполадку, но не смог понять, где и в чем проблема. Я убедился, что возвращаю только два значения (заголовок и заголовок), но не уверен, откуда берутся остальные два значения.
вот моя функция для модели...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
18 янв 2025, 20:19

Вернуться в «Python»