Я изучал GNU tr в bash в Debian Linux. Механизм регулярных выражений, похоже, имеет сокращения [:lower:] и [:upper:]. Регулярное выражение соответствует «строчным» и «прописным» буквам. Их определение нетривиально: является ли Ñ прописной буквой? (Примеры здесь.)
Похоже, что это каким-то образом отображается на «islower» функцию, которая определена на языке C.
https:/ /en.cppreference.com/w/c/string/byte/islower
http://web.archive.org/web/201203081713 ... /reference /clibrary/cctype/islower/
Обратите внимание: то, что считается буквой, может зависеть от используемой локали; В локали C по умолчанию строчная буква — это любая из следующих букв: a b c d e f g h i j k l m n op q r s t u v w x y z.
Для получения подробной информации о том, что такое разные функции ctype возвращают значения для каждого символа стандартного набора символов ANSII, см. ссылку на заголовок.
https://github.com/coreutils/ coreutils/blob/1f0bf8d7c4b7131c6a8762de02ea01affef4db65/src/tr.c#L392
Я не могу найти, где определяется islower, возможно, в конкретной реализации C (например, gcc).< /p>
Похоже, это также зависит от «локали». Это происходит во время компиляции или во время выполнения? https://docs.oracle.com/cd/E19253-01/81 ... index.html
Подробнее здесь: https://stackoverflow.com/questions/791 ... or-isupper
Как C определяет, является ли символ строчной буквой (нижний или верхний)? ⇐ Linux
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение