У меня есть 1-минутные данные временных рядов с столбцами событий и продолжительности. Иногда события не случаются какое -то время, но последнее событие заполняется вперед, пока не произойдет следующее событие. Мы знаем, сколько минут каждые событие должно длиться, я хочу удалить точки данных, которые ложно заполнены вперед.
Это то, как выглядят данные:
Код: Выделить всё
df
datetime event duration
2020-01-01 0:00 x 3
2020-01-01 0:01 x 3
2020-01-01 0:02 x 3
2020-01-01 0:03 y 2
2020-01-01 0:04 y 2
2020-01-01 0:05 z 2
2020-01-01 0:06 z 2
2020-01-01 0:07 z 2
2020-01-01 0:08 x 5
...
Как вы можете видеть в 0:07, столбец события должен быть N/A, но заполнен z, пока следующее событие не произойдет в 0:08, я хочу сделать 0:07 в N/A. В столбце продолжительности рассказывается, сколько строк должно происходить событие. Много раз, когда событие происходит в то время, если это происходит больше, чем сказано в продолжительности, сделайте его NAN до следующего события. x, y, z - все повторяющиеся события, поэтому они происходят несколько раз на протяжении всего.
Подробнее здесь:
https://stackoverflow.com/questions/756 ... -in-pandas