Преобразовать XLS в CSV с помощью Python (заголовки грязные) [закрыто]

Преобразовать XLS в CSV с помощью Python (заголовки грязные) [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Преобразовать XLS в CSV с помощью Python (заголовки грязные) [закрыто]

Сообщение Anonymous » 28 янв 2025, 18:06

Файл .xls, который я хочу преобразовать, как показано на рисунке. Однако, когда я пытаюсь преобразовать его, заголовки испорчены, появляются ненужные пустые столбцы, и некоторые данные не соответствуют смещению.
Я использую следующий код:
import pandas as pd

df = pd.read_excel("data.xls")

df.to_csv("output.csv", index=False, encoding="utf-8")
< /code>
Этот код работает, но я сталкиваюсь с несколькими проблемами: < /p>

[*] Первые несколько строк содержат повторные и ненужные Заголовки.
[*] Некоторые имена столбцов появляются как неназванные.
[*] Файл CSV содержит пустые столбцы, которые не были в исходных данных.
< /ul>
Вот пример первых нескольких строк моего вывода CSV: < /p>
"Banks' employment and key indicators by balance sheet size, 2002-2023",Unnamed: 1,Unnamed: 2,...
"Employment and basic indicators in banks by size of balance sheet's group, 2002-2023",,,,
,,,,
,,,,Employment,,,,,,,,
< /code>
Что мне нужно: < /p>

Удалить ненужные ряды < /li>

экстракт Правильные имена столбцов < /li>

Удалите пустые столбцы < /li>
< /ul>
Как правильно очистить эти данные с помощью пандов? Есть ли конкретные параметры, которые я должен использовать?

Подробнее здесь: https://stackoverflow.com/questions/793 ... -are-messy

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «Python»