Преобразовать CESU-8 в UTF-8 с высокой производительностьюPhp

Кемеровские программисты php общаются здесь
Ответить
Anonymous
 Преобразовать CESU-8 в UTF-8 с высокой производительностью

Сообщение Anonymous »

У меня есть необработанный текст, который обычно является действительной строкой UTF-8. Однако время от времени оказывается, что вход на самом деле является строкой CESU-8. Технически можно обнаружить это и преобразовать в UTF-8, но, как это происходит редко, я бы предпочел не тратить много времени процессора. Я предполагаю, что я всегда мог слепо преобразовать «UTF-8» в UTF-16LE, а затем в UTF-8 с использованием iConv () , и я, вероятно, каждый раз получал бы правильный результат, потому что CESU-8 достаточно близко, чтобы UTF-8 для работы. Можете ли вы предложить что-нибудь быстрее? представлены этими суррогатными парами, а не суррогатными парами.)

Подробнее здесь: https://stackoverflow.com/questions/341 ... erformance
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Php»