Tsfresh помогает вычислить множество полезных функций из входного DataFrame (df). Но я ищу что-то похожее на pd.df.groupby.transform, которое позволяет мне вычислять объекты для каждой группы и помогает присваивать в новом столбце значение вычисляемого объекта всем строкам, принадлежащим эта группа такая:
Код: Выделить всё
groups = df.groupby(group_cols)
df["Std"] = groups["column"].transform('std') # Standard deviation as example
Pandas предоставляет эту функцию группового преобразования только для нескольких статистических функций. Я хочу использовать tsfresh для вычисления комплексных функций и присвоения значений функций каждой строке, принадлежащей группе, в новом столбце. Как я могу это сделать? Я думаю, что это может быть довольно утомительно, если я вручную использую лямбда-функции для каждой функции, которую хочу вычислить в методах pd для более чем 1 тыс. функций.
EDIT: касается df имеет три столбца, включая столбец «группа» со значениями от 1 до 50. С каждой группой связано 10 строк, поэтому всего имеется 500 строк, а номера групп от 1 до 50 повторяются по 10 раз каждый.
Если я использую tsfresh. extract_features(df_1, columns_id = "group"), tsfresh возвращает такой df только с 50 строками:
Я ищу вот это: значения функций, присвоенные всем строкам каждой группы, и общее количество строк в извлеченном объекте df остается 500:

< /п>
Подробнее здесь:
https://stackoverflow.com/questions/785 ... g-to-a-gro