Как выбрать строки между дубликатами в пандах ⇐ Python
-
Anonymous
Как выбрать строки между дубликатами в пандах
У меня есть DataFrame pandas с заказами такси на день. Мне нужно знать, сколько км было потеряно на кругах. Поэтому я не могу понять, как выбирать строки между дубликатами. Для этого кадра данных:
индекс водитель от расстояние 0 Том Манхэттен 35 1 Том Бруклин 40 2 Том Квинс 25 3 Ник Манхэттен 35 4 Ник Бруклин 35 5 Ник Манхэттен 75 6 Ник Квинс 25 7 Криш Квинс 40 8 Криш Бруклин 35 9 Криш Манхэттен 75 10 Криш Квинс 25 11 Джек Квинс 25 12 Джек Бруклин 40 13 Джек Манхэттен 35
Результат будет:
индекс водитель от расстояние 3 Ник Манхэттен 35 4 Ник Бруклин 35 7 Криш Квинс 40 8 Криш Бруклин 35 9 Криш Манхэттен 75
data = {'driver': ['Том', 'Том', 'Том', 'Ник', 'Ник', 'Ник', 'Ник', «Криш», «Криш», «Криш», «Криш», «Джек», «Джек», «Джек»], 'from': ['Манхэттен', 'Бруклин', 'Куинс', 'Манхэттен', 'Бруклин', 'Манхэттен', 'Куинс', «Куинс», «Бруклин», «Манхэттен», «Куинс», «Куинс», «Бруклин», «Манхэттен»], 'расстояние': [35, 40, 25, 35, 35, 75, 25, 40, 35, 75, 25, 25, 40, 35]} Я могу выбрать повторяющиеся строки с помощью df.duliced(['driver', 'from'], Keep=False), но он выбирает только повторяющиеся строки, а не между ними.
У меня есть DataFrame pandas с заказами такси на день. Мне нужно знать, сколько км было потеряно на кругах. Поэтому я не могу понять, как выбирать строки между дубликатами. Для этого кадра данных:
индекс водитель от расстояние 0 Том Манхэттен 35 1 Том Бруклин 40 2 Том Квинс 25 3 Ник Манхэттен 35 4 Ник Бруклин 35 5 Ник Манхэттен 75 6 Ник Квинс 25 7 Криш Квинс 40 8 Криш Бруклин 35 9 Криш Манхэттен 75 10 Криш Квинс 25 11 Джек Квинс 25 12 Джек Бруклин 40 13 Джек Манхэттен 35
Результат будет:
индекс водитель от расстояние 3 Ник Манхэттен 35 4 Ник Бруклин 35 7 Криш Квинс 40 8 Криш Бруклин 35 9 Криш Манхэттен 75
data = {'driver': ['Том', 'Том', 'Том', 'Ник', 'Ник', 'Ник', 'Ник', «Криш», «Криш», «Криш», «Криш», «Джек», «Джек», «Джек»], 'from': ['Манхэттен', 'Бруклин', 'Куинс', 'Манхэттен', 'Бруклин', 'Манхэттен', 'Куинс', «Куинс», «Бруклин», «Манхэттен», «Куинс», «Куинс», «Бруклин», «Манхэттен»], 'расстояние': [35, 40, 25, 35, 35, 75, 25, 40, 35, 75, 25, 25, 40, 35]} Я могу выбрать повторяющиеся строки с помощью df.duliced(['driver', 'from'], Keep=False), но он выбирает только повторяющиеся строки, а не между ними.
Мобильная версия