Любое быстрое исправление/исправление проблем с кодеками? [закрыто]

Любое быстрое исправление/исправление проблем с кодеками? [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Любое быстрое исправление/исправление проблем с кодеками? [закрыто]

Цитата

Сообщение Anonymous » 20 янв 2025, 11:45

Я пытаюсь открыть и прочитать этот CSV-файл в Spyder IDE, а затем в оболочке IDLE. Обе среды выдают ошибку, когда я пытаюсь это сделать, и обе говорят мне:
'utf-8' codec can't decode byte 0xf1 in position 8982: invalid continuation byte

Читая в Интернете, кажется, что это что-то связанное с «реестром кодеков», который, очевидно, относится к тому, как машина или интерпретатор предназначены для интерпретации кодовых символов для различных человеческих языков. Мой набор данных представляет собой опрос домохозяйств в Гондурасе, и хотя большинство ответов являются числовыми, некоторые из них на испанском языке, и в целом здесь используется испанский язык, хотя похоже, что все данные на самом деле были введены пользователем с клавиатуры на английском языке. потому что в довольно большом тексте нет отчетливо испанских символов (например, ñ).
Я исследовал некоторые онлайн-кодеки в надежде найти простой патч кода, импорт или модуль, который можно сделать какой-то тип конверсии. Но все, что я нахожу, - это плотное чтение, может быть, 10-20 страниц, большая часть которых кажется не связанной с тем, что я пытаюсь сделать. Судя по тому, что я смог увидеть, мне нужно импортировать sys и выполнить несколько функций для настройки кодеков.
Но до Python я фактически загружал, открывал, читал, выбирал , распечатал и т. д. и т. д. именно этот набор данных с помощью SQL в Big Query. А также с языком R в Posit. Ни с одним другим языком/средой подобных проблем не возникало.
Есть ли у кого-нибудь предложения по преодолению этого препятствия?
import numpy as np

import pandas as pd

import sys

sys.stdin.reconfigure(encoding="utf-8")

mystdout = open("myfile.csv", "wt", encoding="utf=8")

Y = pd.read_csv("C:....csv")

Подробнее здесь: https://stackoverflow.com/questions/793 ... c-problems

1737362754

Anonymous

Я пытаюсь открыть и прочитать этот CSV-файл в Spyder IDE, а затем в оболочке IDLE. Обе среды выдают ошибку, когда я пытаюсь это сделать, и обе говорят мне:
'utf-8' codec can't decode byte 0xf1 in position 8982: invalid continuation byte

Читая в Интернете, кажется, что это что-то связанное с «реестром кодеков», который, очевидно, относится к тому, как машина или интерпретатор предназначены для интерпретации кодовых символов для различных человеческих языков. Мой набор данных представляет собой опрос домохозяйств в Гондурасе, и хотя большинство ответов являются числовыми, некоторые из них на испанском языке, и в целом здесь используется испанский язык, хотя похоже, что все данные на самом деле были введены пользователем с клавиатуры на английском языке. потому что в довольно большом тексте нет отчетливо испанских символов (например, ñ).
Я исследовал некоторые онлайн-кодеки в надежде найти простой патч кода, импорт или модуль, который можно сделать какой-то тип конверсии. Но все, что я нахожу, - это плотное чтение, может быть, 10-20 страниц, большая часть которых кажется не связанной с тем, что я пытаюсь сделать. Судя по тому, что я смог увидеть, мне нужно импортировать sys и выполнить несколько функций для настройки кодеков.
Но до Python я фактически загружал, открывал, читал, выбирал , распечатал и т. д. и т. д. именно этот набор данных с помощью SQL в Big Query. А также с языком R в Posit. Ни с одним другим языком/средой подобных проблем не возникало.
Есть ли у кого-нибудь предложения по преодолению этого препятствия?
import numpy as np

import pandas as pd

import sys

sys.stdin.reconfigure(encoding="utf-8")

mystdout = open("myfile.csv", "wt", encoding="utf=8")

Y = pd.read_csv("C:....csv")
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79370710/any-type-of-quick-fix-patch-for-codec-problems[/url]