Используя Pandas, вы можете объединить несколько кадров данных со столбцом метки времени и общими столбцами (в данном случае) станцией, долготой, широтой и несколькими столбцами переменных в отдельных файлах, но не дублировать общие столбцы или не иметь несколько строк для столбца времени. в конечном результате?
Примеры первого входного файла:
pd.merge (а также merge_ordered и merge_asof), похоже, не работает должным образом с индексом из нескольких столбцов или возвращает повторяющиеся столбцы с суффиксами для станции, широты и долготы.
Преобразование столбца времени в индекс даты и времени и использование pd.concat кажется правильным способом... но тогда как исправить отдельные строки времени и избавиться от значения NaN? Я думал, что группировка по индексу может быть хорошим решением, но как?
Используя Pandas, вы можете объединить несколько кадров данных со столбцом метки времени и общими столбцами (в данном случае) станцией, долготой, широтой и несколькими столбцами переменных в отдельных файлах, но не дублировать общие столбцы или не иметь несколько строк для столбца времени. в конечном результате? Примеры первого входного файла: [code]time,station,latitude[unit="degrees_north"],longitude[unit="degrees_east"],ta50m[unit="K"] 2023-01-01T00:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,300.1109619140625 2023-01-01T01:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,301.6109619140625 2023-01-01T02:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,303.60748291015625 [/code] Примеры второго входного файла: [code]time,station,latitude[unit="degrees_north"],longitude[unit="degrees_east"],ua50m[unit="m s-1"] 2023-01-01T00:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,-3.38525390625 2023-01-01T01:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,-5.17431640625 2023-01-01T02:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,-7.213134765625 [/code] Третий+ входной файл: [code]time,station,latitude[unit="degrees_north"],longitude[unit="degrees_east"],ua50m[unit="m s-1"] 2023-02-01T00:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,-2.19775390625 2023-02-01T01:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,-1.4140625 2023-02-01T02:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.540,133.360,-0.692626953125 [/code] (Желательно) Целевой файл: [code]time,station,"latitude[unit=""degrees_north""]","longitude[unit=""degrees_east""]","ta50m[unit=""K""]","ua50m[unit=""m s-1""]" 2023-01-01T00:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.54,133.36,300.1109619140625,-3.38525390625 2023-01-01T01:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.54,133.36,301.6109619140625,-5.17431640625 2023-01-01T02:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.54,133.36,303.60748291015625,-7.213134765625 ... 2023-02-01T00:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.54,133.36,292.739501953125,-2.19775390625 2023-02-01T01:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.54,133.36,293.239501953125,-1.4140625 [/code] pd.merge (а также merge_ordered и merge_asof), похоже, не работает должным образом с индексом из нескольких столбцов или возвращает повторяющиеся столбцы с суффиксами для станции, широты и долготы. [code]time,station,"latitude[unit=""degrees_north""]","longitude[unit=""degrees_east""]","ta50m[unit=""K""]","ua50m[unit=""m s-1""]_x","ua50m[unit=""m s-1""]_y" 2023-01-01T00:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.54,133.36,300.1109619140625,-3.38525390625,NULL 2023-01-01T01:00:00Z,GridPointRequestedAt[23.553S_133.396E],-23.54,133.36,301.6109619140625,-5.17431640625,NULL [/code] Преобразование столбца времени в индекс даты и времени и использование pd.concat кажется правильным способом... но тогда как исправить отдельные строки времени и избавиться от значения NaN? Я думал, что группировка по индексу может быть хорошим решением, но как?
Используя Pandas, вы можете объединить несколько кадров данных со столбцом метки времени и общими столбцами (в данном случае) станцией, долготой, широтой и несколькими столбцами переменных в отдельных файлах, но не дублировать общие столбцы или не...
Используя Pandas, вы можете объединить несколько кадров данных со столбцом метки времени и общими столбцами (в данном случае) станцией, долготой, широтой и несколькими столбцами переменных в отдельных файлах, но не дублировать общие столбцы или не...
Используя Pandas, вы можете объединить несколько кадров данных со столбцом метки времени и общими столбцами (в данном случае) станцией, долготой, широтой и несколькими столбцами переменных в отдельных файлах, но не дублировать общие столбцы или не...