Polars присоединится в следующую доступную датуPython

Программы на Python
Anonymous
 Polars присоединится в следующую доступную дату

Сообщение Anonymous »

У меня есть кадр (события), который я хочу объединить с другим кадром (fr), присоединившись по дате и символу. Даты не обязательно совпадают. Дата в событиях будет совпадать с первым появлением только в ту же или более позднюю дату во fr, поэтому, если дата события 01.12.2010, оно присоединится к той же дате, а если нет, то к следующей доступной дате (02.12.2010).
Я пытался сделать это с помощью search_sorted и join_asof, но я хотел бы сгруппировать по столбцу «Символ», и это не правильное объединение. В некоторой степени это работает только для одного символа.
fr = pl.DataFrame(
{
'Symbol': ['A']*5,
'Date': ['2010-08-29', '2010-09-01', '2010-09-05',
'2010-11-30', '2010-12-02'],
}
).with_columns(pl.col('Date').str.to_date('%Y-%m-%d')).with_row_index().set_sorted("Date")

events = pl.DataFrame(
{
'Symbol': ['A']*3,
'Earnings_Date': ['2010-06-01', '2010-09-01', '2010-12-01'],
'Event': [1, 4, 7],
}
).with_columns(pl.col('Earnings_Date').str.to_date('%Y-%m-%d')).set_sorted("Earnings_Date")

idx = fr["Date"].search_sorted(events["Earnings_Date"], "left")

fr = fr.with_columns(
pl.when(
pl.col("index").is_in(idx)
)
.then(True)
.otherwise(False)
.alias("Earnings")
)

fr = fr.join_asof(events, by="Symbol", left_on="Date", right_on="Earnings_Date")
fr = fr.with_columns(
pl.when(
pl.col("Earnings") == True
)
.then(pl.col("Event"))
.otherwise(False)
.alias("Event")
)


Подробнее здесь: https://stackoverflow.com/questions/782 ... lable-date

Вернуться в «Python»