У меня есть некоторое программное обеспечение, которое поддерживает файлы конфигурации UTF-8.
У него нет обширной поддержки Unicode, просто файлы анализа.
Код: Выделить всё
std::string code_point_to_string(char32_t c);
Например, если C Is u '\ n {Zero-Width Joiner}' (u+200d), я хотел бы вернуть «стопорщика с нулевой шириной» как строка. /> Я знаю, что возвращение "u+200d" было бы довольно простым, но эти представления u+ являются некоторыми пользовательскими хостиле; Вы посмотрите, что означают персонажи.
Подробнее здесь:
https://stackoverflow.com/questions/796 ... reak-space