Я ищу оптимизированный способ проверки наличия дубликатов в столбце фрейма данных Panda, но исключающий заданную позицию в каждом элементе этого столбца.
В примере есть дублирование в 'id1_ver1_ready', если исключить номер версии ('id1_ver1_ready' 'id1_ver3_ready'). То же самое для ( 'id5_ver1_unknown' 'id5_ver6_unknown')
from numpy import nan
df = pd.DataFrame({'ID': ['id1_ver1_ready', 'id2_ver1_unknown', 'id3_ver1_processed', 'id1_ver3_ready', 'id4_ver1_ready', 'id5_ver1_unknown', 'id5_ver6_unknown', 'id6_ver1_processed']})enter code here
Подробнее здесь: https://stackoverflow.com/questions/790 ... sub-string
Проверьте наличие дубликатов в столбце, исключив подстроку ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Проверьте на наличие дубликатов с большой стратегией наборов данных [закрыто]
Anonymous » » в форуме Php - 0 Ответы
- 5 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Проверьте на наличие дубликатов с большой стратегией наборов данных [закрыто]
Anonymous » » в форуме MySql - 0 Ответы
- 5 Просмотры
-
Последнее сообщение Anonymous
-