Проверьте наличие дубликатов в столбце, исключив подстроку

Проверьте наличие дубликатов в столбце, исключив подстроку ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Проверьте наличие дубликатов в столбце, исключив подстроку

Цитата

Сообщение Anonymous » 07 окт 2024, 17:47

Я ищу оптимизированный способ проверки наличия дубликатов в столбце фрейма данных Panda, но исключающий заданную позицию в каждом элементе этого столбца.
В примере есть дублирование в 'id1_ver1_ready', если исключить номер версии ('id1_ver1_ready' 'id1_ver3_ready'). То же самое для ( 'id5_ver1_unknown' 'id5_ver6_unknown')
from numpy import nan
df = pd.DataFrame({'ID': ['id1_ver1_ready', 'id2_ver1_unknown', 'id3_ver1_processed', 'id1_ver3_ready', 'id4_ver1_ready', 'id5_ver1_unknown', 'id5_ver6_unknown', 'id6_ver1_processed']})enter code here

Подробнее здесь: https://stackoverflow.com/questions/790 ... sub-string

1728312456

Anonymous

Я ищу оптимизированный способ проверки наличия дубликатов в столбце фрейма данных Panda, но исключающий заданную позицию в каждом элементе этого столбца.
В примере есть дублирование в 'id1_ver1_ready', если исключить номер версии ('id1_ver1_ready'  'id1_ver3_ready'). То же самое для ( 'id5_ver1_unknown'  'id5_ver6_unknown')
from numpy import nan
df = pd.DataFrame({'ID': ['id1_ver1_ready', 'id2_ver1_unknown', 'id3_ver1_processed', 'id1_ver3_ready', 'id4_ver1_ready', 'id5_ver1_unknown', 'id5_ver6_unknown', 'id6_ver1_processed']})enter code here
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79062305/check-for-duplicates-in-a-column-while-excluding-a-sub-string[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Проверьте наличие дубликатов в столбце, исключив подстроку

Последнее сообщение Anonymous « 07 окт 2024, 17:14
Добавлено в форуме Python

Anonymous » 07 окт 2024, 17:14 » в форуме Python

Я ищу оптимизированный способ проверки наличия дубликатов в столбце фрейма данных Panda, но исключающий заданную позицию в каждом элементе этого столбца.
В примере есть дублирование в 'id1_ver1_ready', если исключить номер версии ('id1_ver1_ready'...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
07 окт 2024, 17:14
Проверьте на наличие дубликатов с большой стратегией наборов данных [закрыто]

Последнее сообщение Anonymous « 23 июл 2025, 18:58
Добавлено в форуме Php

Anonymous » 23 июл 2025, 18:58 » в форуме Php

Мне нужно реализовать дублированный поиск с довольно большими наборами данных. Я работаю с JS, PHP, MySQL.
У меня есть записи таблицы базы данных , каждая запись содержит данные , полученные из электронной таблицы. Количество строк данных находится...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
23 июл 2025, 18:58
Проверьте на наличие дубликатов с большой стратегией наборов данных [закрыто]

Последнее сообщение Anonymous « 23 июл 2025, 18:58
Добавлено в форуме MySql

Anonymous » 23 июл 2025, 18:58 » в форуме MySql

Мне нужно реализовать дублированный поиск с довольно большими наборами данных. Я работаю с JS, PHP, MySQL.
У меня есть записи таблицы базы данных , каждая запись содержит данные , полученные из электронной таблицы. Количество строк данных находится...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
23 июл 2025, 18:58
Хэш для дубликатов изображений работает не для всех дубликатов.

Последнее сообщение Anonymous « 28 окт 2023, 15:32
Добавлено в форуме JAVA

Anonymous » 28 окт 2023, 15:32 » в форуме JAVA

Мне нужно обнаружить дубликаты изображений. Вот что я сделал:

попробуй { MessageDigest messageDigest = MessageDigest.getInstance( SHA-512 ); FileInputStream fi = новый FileInputStream (файл); байт fileData[] = новый байт ; fi.read(fileData);...

0 Ответы

97 Просмотры

Последнее сообщение Anonymous
28 окт 2023, 15:32
Использование re для сопоставления цифры + любых смежных дубликатов и сохранение дубликатов, а не только цифры в качеств

Последнее сообщение Anonymous « 12 окт 2024, 07:39
Добавлено в форуме Python

Anonymous » 12 окт 2024, 07:39 » в форуме Python

Я пытаюсь использовать re.findall(pattern, string) для сопоставления всех чисел, независимо от того, сколько дубликатов следует за строкой. Например. «1222344» соответствует «1», «222», «3», «44». Кажется, я не могу найти шаблон для этого.
Я пытался...

0 Ответы

61 Просмотры

Последнее сообщение Anonymous
12 окт 2024, 07:39

Вернуться в «Python»