Я использую поляры вместо панд. Я очень поражен скоростью и ленивыми вычислениями/оценками. Сейчас существует множество методов работы с ленивым фреймом данных, но они не могут меня завести.
Итак, мне интересно, как лучше всего использовать полярные поля в сочетании с другими инструментами для выполнения более сложных операций, таких как регрессия/подбор модели.
Чтобы быть более конкретным, я приведу пример, включающий линейную регрессию.
Предположим, у меня есть полярный фрейм данных со столбцами day, y, x1 и x2, и я хочу сгенерировать ряд, который представляет собой остаток регрессии y по группам x1 и x2 по дням. Я включил следующий пример кода и рассказал, как его можно решить с помощью панд и статистических моделей. Как я могу получить тот же результат с наибольшей эффективностью, используя идиоматические поляры?
Я использую поляры вместо панд. Я очень поражен скоростью и ленивыми вычислениями/оценками. Сейчас существует множество методов работы с ленивым фреймом данных, но они не могут меня завести. Итак, мне интересно, как лучше всего использовать полярные поля в сочетании с другими инструментами для выполнения более сложных операций, таких как регрессия/подбор модели. Чтобы быть более конкретным, я приведу пример, включающий линейную регрессию. Предположим, у меня есть полярный фрейм данных со столбцами day, y, x1 и x2, и я хочу сгенерировать ряд, который представляет собой остаток регрессии y по группам x1 и x2 по дням. Я включил следующий пример кода и рассказал, как его можно решить с помощью панд и статистических моделей. Как я могу получить тот же результат с наибольшей эффективностью, используя идиоматические поляры? [code]import pandas as pd import statsmodels.api as sm
def regress_resid(df, yvar, xvars): result = sm.OLS(df[yvar], sm.add_constant(df[xvars])).fit() return result.resid