Включить старый фрейм данных pandas после слияния ⇐ Python
-
Anonymous
Включить старый фрейм данных pandas после слияния
Я использую этот код для создания кадра данных, объединенного из множества разных файлов. Однако окончательный фрейм данных не содержит всех столбцов исходного фрейма данных «df». Есть ли способ включить все столбцы «df» в окончательные сгенерированные «merged_data»?
импортировать библиотеку путей импортировать панд как pd root_path = pathlib.Path('root') # используйте pathlib вместо os.path данные = {} # используйте перечисление вместо создания внешнего счетчика для счетчика (_, строка) в enumerate(df.iterrows(), 1): имя_папки = строка['ID файла'].strip() имя_файла = строка['Имя файла'].strip() путь_файла = корневой_путь / имя_папки / имя_файла folder_file_id = f'{имя_папки}_{имя_файла}' file_data = pd.read_csv(file_path, header=None, sep='\t', имена = ['Дело',folder_file_id], Memory_map=True, low_memory=False) data[folder_file_id] = file_data.set_index('Case').squeeze() распечатать (подсчитать) merged_data = (pd.concat(data, name=['folder_file_id']) .unstack('Case').reset_index())
Я использую этот код для создания кадра данных, объединенного из множества разных файлов. Однако окончательный фрейм данных не содержит всех столбцов исходного фрейма данных «df». Есть ли способ включить все столбцы «df» в окончательные сгенерированные «merged_data»?
импортировать библиотеку путей импортировать панд как pd root_path = pathlib.Path('root') # используйте pathlib вместо os.path данные = {} # используйте перечисление вместо создания внешнего счетчика для счетчика (_, строка) в enumerate(df.iterrows(), 1): имя_папки = строка['ID файла'].strip() имя_файла = строка['Имя файла'].strip() путь_файла = корневой_путь / имя_папки / имя_файла folder_file_id = f'{имя_папки}_{имя_файла}' file_data = pd.read_csv(file_path, header=None, sep='\t', имена = ['Дело',folder_file_id], Memory_map=True, low_memory=False) data[folder_file_id] = file_data.set_index('Case').squeeze() распечатать (подсчитать) merged_data = (pd.concat(data, name=['folder_file_id']) .unstack('Case').reset_index())
Мобильная версия