Я пытаюсь открыть и прочитать этот CSV-файл в Spyder IDE, а затем в оболочке IDLE. Обе среды выдают ошибку, когда я пытаюсь это сделать, и обе говорят мне:
'utf-8' codec can't decode byte 0xf1 in position 8982: invalid continuation byte
Читая в Интернете, кажется, что это что-то связанное с «реестром кодеков», который, очевидно, относится к тому, как машина или интерпретатор предназначены для интерпретации кодовых символов для различных человеческих языков. Мой набор данных представляет собой опрос домохозяйств в Гондурасе, и хотя большинство ответов являются числовыми, некоторые из них на испанском языке, и в целом здесь используется испанский язык, хотя похоже, что все данные на самом деле были введены пользователем с клавиатуры на английском языке. потому что в довольно большом тексте нет отчетливо испанских символов (например, ñ).
Я исследовал некоторые онлайн-кодеки в надежде найти простой патч кода, импорт или модуль, который можно сделать какой-то тип конверсии. Но все, что я нахожу, - это плотное чтение, может быть, 10-20 страниц, большая часть которых кажется не связанной с тем, что я пытаюсь сделать. Судя по тому, что я смог увидеть, мне нужно импортировать sys и выполнить несколько функций для настройки кодеков.
Но до Python я фактически загружал, открывал, читал, выбирал , распечатал и т. д. и т. д. именно этот набор данных с помощью SQL в Big Query. А также с языком R в Posit. Ни с одним другим языком/средой подобных проблем не возникало.
Есть ли у кого-нибудь предложения по преодолению этого препятствия?
import numpy as np
import pandas as pd
import sys
sys.stdin.reconfigure(encoding="utf-8")
mystdout = open("myfile.csv", "wt", encoding="utf=8")
Y = pd.read_csv("C:....csv")
Подробнее здесь: https://stackoverflow.com/questions/793 ... c-problems
Любое быстрое исправление/исправление проблем с кодеками? [закрыто] ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение