Я рассматривал подобные вопросы, например «Почему re не игнорирует диакритические знаки», но предлагаемое решение — нормализовать строку Юникода в ASCII. Это можно было бы заставить работать, но оно кажется чрезмерно уродливым и не возвращает фактический текст, который должен отображаться.
Разве в Python нет ничего аналогичного классам эквивалентности символов POSIX, которые сопоставляют похожие символы вместе в зависимости от локали пользователя? Например,
Код: Выделить всё
grep '[[=e=]][[=p=]][[=e=]][[=e=]]'Обновление: изначально я упомянул ввод через «ASCII-клавиатуру», хотя мне следовало просто сказать «ASCII-ввод». Способ ввода не имеет значения.
Подробнее здесь: https://stackoverflow.com/questions/798 ... -in-python
Мобильная версия