У меня есть строка, которая заполняется данными из другой программы, и эти данные могут быть в кодировке UTF8 или нет. Итак, если нет, я могу закодировать в UTF8, но как лучше всего обнаружить UTF8 в C++? Я видел этот вариант
https://stackoverflow.com/questions/... но есть комментарии, в которых говорится, что эти решения не дают 100% обнаружения. Поэтому, если я кодирую строку UTF8, которая уже содержит данные UTF8, я записываю неправильный текст в базу данных.
Так что я могу просто использовать это обнаружение UTF8:
Код: Выделить всё
bool is_utf8(const char * string)
{
if(!string)
return 0;
const unsigned char * bytes = (const unsigned char *)string;
while(*bytes)
{
if( (// ASCII
// use bytes[0]
Подробнее здесь: [url]https://stackoverflow.com/questions/28270310/how-to-easily-detect-utf8-encoding-in-the-string[/url]