Как вы видите, у нас есть одинаковый 001, 002, 003 , но префикс отличается. Поэтому я не хочу жесткого кода 001, 002, 003 , но автоматически вычитайте его, как указано выше.
# Chuyển thành DataFrame df = pd.DataFrame(data) [/code]
Теперь я хочу вычесть данные между столбцами, которые имеют тот же субфикс, что и ниже Принцип: < /p> [code]df['diff_1_001'] = df[date_3 + '_001'] - df[date_2 + '_001'] df['diff_2_001'] = df[date_3 + '_001'] - df[date_1 + '_001'] df['diff_1_002'] = df[date_3 + '_002'] - df[date_2 + '_002'] df['diff_2_002'] = df[date_3 + '_002'] - df[date_1 + '_002'] df['diff_1_003'] = df[date_3 + '_003'] - df[date_2 + '_003'] df['diff_2_003'] = df[date_3 + '_003'] - df[date_1 + '_003'] df [/code] Как вы видите, у нас есть одинаковый 001, 002, 003 , но префикс отличается. Поэтому я не хочу жесткого кода 001, 002, 003 , но автоматически вычитайте его, как указано выше.
Буду признателен за советы по оптимизации.
У меня есть фрейм данных pandas, который имеет около 4500 столбцов и 50 000 строк.
Есть 2 типа столбцов, один из которых начинается с буквы A , а другой - с буквы B .
примеры столбцов
Буду признателен за советы по оптимизации.
У меня есть фрейм данных pandas, который имеет около 4500 столбцов и 50 000 строк.
Есть 2 типа столбцов, один из которых начинается с буквы A , а другой - с буквы B .
примеры столбцов