Код: Выделить всё
dataset = {name.replace('/', '.'): f'{name}/*.parquet' for name in ["train", "test"]}
dataset = load_dataset("parquet", data_files=dataset)
Поскольку столбцы не совпадают, при загрузке я получаю сообщение об ошибке:
Код: Выделить всё
datasets.table.CastError: Couldn't cast
column1: string
column2: list
child 0, item: string
column3: list
child 0, item: int32
__index_level_0__: int64
-- schema metadata --
pandas: '{"index_columns": ["__index_level_0__"], "column_indexes": [{"na' + 1438
to
{'column1': Value(dtype='string', id=None), 'column2': Sequence(feature=Value(dtype='string', id=None), length=-1, id=None), '__index_level_0__': Value(dtype='int64', id=None)}
Код: Выделить всё
column3
Как правильно загрузить обучение и тестирование с разным набором столбцов?
Подробнее здесь: https://stackoverflow.com/questions/792 ... of-columns