Однако, когда я проверяю данные, строковый столбец «movie_title» помещает все данные этой строки в первый столбец. Это происходит всякий раз, когда в «movie_title» присутствует запятая «,».
Чтобы обойти эту проблему, я добавил аргумент «quotechar» в read_csv. Это распределяет данные по столбцам. Однако теперь в столбце 1 стоит начальный ", а в столбце -1 - завершающий ".
MRE
Код: Выделить всё
import pandas as pd
# when hosted in the cloud, repos can be public or private. this repo is public.
repo = "gs://minimum-reproduceable-2152532/item.csv"
cols = ["movie_id", "movie_title", "release_date", "video_release_date", "IMDB_url", "unknown", "Action", "Adventure", "Animation", "Childrens", "Comedy", "Crime", "Documentary", "Drama", "Fantasy", "Film-Noir", "Horror", "Musical", "Mystery", "Romance", "Sci-Fi", "Thriller", "War", "Western"]
df = pd.read_csv(repo, sep="|", names=cols, encoding="latin-1")
df.iloc[10:15, ::]
См. столбец 1, строки 11 и 13.
Есть есть ли способ справиться с этим в пандах или мне придется превзойти Excel?
Подробнее здесь: https://stackoverflow.com/questions/792 ... ing-column
Мобильная версия