Сократите интервалы дат, чтобы объединить определенные даты ⇐ Python
Сократите интервалы дат, чтобы объединить определенные даты
У меня есть большой набор данных с несколькими id и несколькими интервалами дат.
Я пытаюсь сократить эти интервалы, чтобы объединить конкретные даты для каждого id.
Ниже приведен небольшой воспроизводимый пример
импортировать панд как pd иметь = {'id': [1,1], 'start_date': ['2014-12-01 00:00:00', '2015-03-01 00:00:00'], 'end_date': ['2015-02-28 23:59:59', '2015-05-31 23:59:59']} иметь = pd.DataFrame (данные = иметь) иметь идентификатор start_date end_date 0 1 01.12.2014 00:00:00 28.02.2015 23:59:59 1 1 01.03.2015 00:00:00 31.05.2015 23:59:59 # Конкретные даты для интеграции конкретные_dt = ['2015-01-01 00:00:00', '2015-03-31 00:00:00'] want = {'id': [1,1,1,1], 'start_date': ['2014-12-01 00:00:00', '2015-01-01 00:00:00', '2015-03-01 00:00:00', '2015-03-31 00:00:00'], 'end_date': ['2014-12-31 23:59:59', '2015-02-28 23:59:59', '2015-03-30 23:59:59', '2015-05-31 23:59:59']} хочу = pd.DataFrame(данные = хочу) хотеть идентификатор start_date end_date 0 1 01.12.2014 00:00:00 31.12.2014 23:59:59 1 1 01.01.2015 00:00:00 28.02.2015 23:59:59 2 1 01.03.2015 00:00:00 30.03.2015 23:59:59 3 1 31.03.2015 00:00:00 31.05.2015 23:59:59 Я думал перебрать все start_date и end_date, чтобы проверить, находятся ли между ними какие-либо конкретные даты, но мой набор данных довольно большой.
Обратите внимание, что помимо этих трех столбцов в файле df есть еще более 30 столбцов. Я хотел бы иметь возможность создавать эти интервалы на месте.
У меня есть большой набор данных с несколькими id и несколькими интервалами дат.
Я пытаюсь сократить эти интервалы, чтобы объединить конкретные даты для каждого id.
Ниже приведен небольшой воспроизводимый пример
импортировать панд как pd иметь = {'id': [1,1], 'start_date': ['2014-12-01 00:00:00', '2015-03-01 00:00:00'], 'end_date': ['2015-02-28 23:59:59', '2015-05-31 23:59:59']} иметь = pd.DataFrame (данные = иметь) иметь идентификатор start_date end_date 0 1 01.12.2014 00:00:00 28.02.2015 23:59:59 1 1 01.03.2015 00:00:00 31.05.2015 23:59:59 # Конкретные даты для интеграции конкретные_dt = ['2015-01-01 00:00:00', '2015-03-31 00:00:00'] want = {'id': [1,1,1,1], 'start_date': ['2014-12-01 00:00:00', '2015-01-01 00:00:00', '2015-03-01 00:00:00', '2015-03-31 00:00:00'], 'end_date': ['2014-12-31 23:59:59', '2015-02-28 23:59:59', '2015-03-30 23:59:59', '2015-05-31 23:59:59']} хочу = pd.DataFrame(данные = хочу) хотеть идентификатор start_date end_date 0 1 01.12.2014 00:00:00 31.12.2014 23:59:59 1 1 01.01.2015 00:00:00 28.02.2015 23:59:59 2 1 01.03.2015 00:00:00 30.03.2015 23:59:59 3 1 31.03.2015 00:00:00 31.05.2015 23:59:59 Я думал перебрать все start_date и end_date, чтобы проверить, находятся ли между ними какие-либо конкретные даты, но мой набор данных довольно большой.
Обратите внимание, что помимо этих трех столбцов в файле df есть еще более 30 столбцов. Я хотел бы иметь возможность создавать эти интервалы на месте.
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Нет отключенных дат в средстве выбора даты с использованием массива дат php.
Anonymous » » в форуме Php - 0 Ответы
- 9 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Нет отключенных дат в средстве выбора даты с использованием массива дат php.
Anonymous » » в форуме Jquery - 0 Ответы
- 13 Просмотры
-
Последнее сообщение Anonymous
-