Я использую следующий код:
import pandas as pd
df = pd.read_excel("data.xls")
df.to_csv("output.csv", index=False, encoding="utf-8")
< /code>
Этот код работает, но я сталкиваюсь с несколькими проблемами: < /p>
[*] Первые несколько строк содержат повторные и ненужные Заголовки.
[*] Некоторые имена столбцов появляются как неназванные.
[*] Файл CSV содержит пустые столбцы, которые не были в исходных данных.
< /ul>
Вот пример первых нескольких строк моего вывода CSV: < /p>
"Banks' employment and key indicators by balance sheet size, 2002-2023",Unnamed: 1,Unnamed: 2,...
"Employment and basic indicators in banks by size of balance sheet's group, 2002-2023",,,,
,,,,
,,,,Employment,,,,,,,,
< /code>
Что мне нужно: < /p>
< /ul>
Как правильно очистить эти данные с помощью пандов? Есть ли конкретные параметры, которые я должен использовать?
Подробнее здесь: https://stackoverflow.com/questions/793 ... -are-messy