Преобразовать CESU-8 в UTF-8 с высокой производительностью

Преобразовать CESU-8 в UTF-8 с высокой производительностью ⇐ Php

1 сообщение • Страница 1 из 1

Anonymous

Преобразовать CESU-8 в UTF-8 с высокой производительностью

Цитата

Сообщение Anonymous » 08 май 2025, 13:39

У меня есть необработанный текст, который обычно является действительной строкой UTF-8. Однако время от времени оказывается, что вход на самом деле является строкой CESU-8. Технически можно обнаружить это и преобразовать в UTF-8, но, как это происходит редко, я бы предпочел не тратить много времени процессора. Я предполагаю, что я всегда мог слепо преобразовать «UTF-8» в UTF-16LE, а затем в UTF-8 с использованием iConv () , и я, вероятно, каждый раз получал бы правильный результат, потому что CESU-8 достаточно близко, чтобы UTF-8 для работы. Можете ли вы предложить что-нибудь быстрее? представлены этими суррогатными парами, а не суррогатными парами.)

Подробнее здесь: https://stackoverflow.com/questions/341 ... erformance

1746700754

Anonymous

 У меня есть необработанный текст, который обычно является действительной строкой UTF-8. Однако время от времени оказывается, что вход на самом деле является строкой CESU-8. Технически можно обнаружить это и преобразовать в UTF-8, но, как это происходит редко, я бы предпочел не тратить много времени процессора. Я предполагаю, что я всегда мог слепо преобразовать «UTF-8» в UTF-16LE, а затем в UTF-8 с использованием iConv () , и я, вероятно, каждый раз получал бы правильный результат, потому что CESU-8 достаточно близко, чтобы UTF-8 для работы.  Можете ли вы предложить что-нибудь быстрее? представлены этими суррогатными парами, а не суррогатными парами.)   

Подробнее здесь: [url]https://stackoverflow.com/questions/34151138/convert-cesu-8-to-utf-8-with-high-performance[/url]

Ответить

1 сообщение • Страница 1 из 1