Я работаю с базой данных DuckDB (mersed.duckdb), содержащей данные аукциона в таблице с именем auction_timeseries, заказанную Auction_id и Auction_active_Date. Схема:
oach /> total_view_count : кумулятивные представления до этой даты.
doping_is_active : двоичный (0 или 1) указывает, является ли допинг (повышение видимости). 'Dpoing b', 'допинг c' или null, если нет допинга).
cat_level_0_name to cat_level_3_name : иерархия категории. total_view_count - E.G., сколько раз больше просмотров, когда DOPING_IS_ACTION = 1 против 0 или для конкретных типов допинга. Например, допинг допинг в 2x или 10 раз больше ежедневных просмотров? Я рассматриваю регрессию панели с фиксированными эффектами для аукциона_id для учета факторов, специфичных для аукциона, но я не уверен, является ли это лучшим подходом, учитывая природу временных рядов данных. Вот соответствующий код: < /p>
import duckdb
import pandas as pd
import numpy as np
# Connect to DuckDB
con = duckdb.connect('merged.duckdb')
# Calculate doping multipliers
multipliers = con.execute("""
SELECT
(AVG(CASE WHEN doping_is_active = 1 THEN daily_view_count ELSE NULL END) /
NULLIF(AVG(CASE WHEN doping_is_active = 0 THEN daily_view_count ELSE NULL END), 0)) AS overall_doping_multiplier,
(AVG(CASE WHEN doping_name = 'Doping A' THEN daily_view_count ELSE NULL END) /
NULLIF(AVG(CASE WHEN doping_name IS NULL THEN daily_view_count ELSE NULL END), 0)) AS DopingA_multiplier,
(AVG(CASE WHEN doping_name = 'Doping B' THEN daily_view_count ELSE NULL END) /
NULLIF(AVG(CASE WHEN doping_name IS NULL THEN daily_view_count ELSE NULL END), 0)) AS DopingB_multiplier,
(AVG(CASE WHEN doping_name = 'Doping C' THEN daily_view_count ELSE NULL END) /
NULLIF(AVG(CASE WHEN doping_name IS NULL THEN daily_view_count ELSE NULL END), 0)) AS DopingC_multiplier
FROM main.auction_timeseries
""").fetchone()
print("\nDoping Multipliers:")
print(f"Overall Doping Multiplier: {multipliers[0] if multipliers[0] else 'Undefined'}")
print(f"Doping A Multiplier: {multipliers[1] if multipliers[1] else 'Undefined'}")
print(f"Doping B Multiplier: {multipliers[2] if multipliers[2] else 'Undefined'}")
print(f"Doping C Multiplier: {multipliers[3] if multipliers[3] else 'Undefined'}")
con.close()
< /code>
Вопросы: < /p>
Регрессия панели (например, модель с фиксированными эффектами для аукции_ид) логична для оценки множителя допинга? Почему или почему нет?>
Подробнее здесь: https://stackoverflow.com/questions/797 ... y-and-tota
Подходит ли регрессия панели для количественной оценки множителя допинга в день и общего просмотра в Python с данными вр ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение