Код: Выделить всё
"© 2024 • Printing & Publishing Co., Inc. • All Rights Reserved"
"u00a9 2024 u00a0 u2022 u00a0 Printing & Publishing Co., Inc. u00a0 u2022 u00a0 Все Права защищены»
Это выглядит как кодировка UTF-16 без начальных «\" или «0x». Конфигурация расширения iconv, возвращаемая iconv_get_encoding:
Код: Выделить всё
[input_encoding] => UTF-8
[output_encoding] => UTF-8
[internal_encoding] => UTF-8
Я пробовал всевозможные варианты html_entity_decode. , mb_convert_encoding и даже сопоставление регулярных выражений для "'/u([0-9a-fA-F]{4})/'" для перехвата этих, казалось бы, символов в кодировке UTF-16, но все безрезультатно. Я продолжаю получать:
Код: Выделить всё
"u00a9 2024 u00a0 u2022 u00a0 Printing & Publishing Co., Inc. u00a0 u2022 u00a0 All Rights Reserved"
Код: Выделить всё
"u00a9 2024 u00a0 u2022 u00a0 Printing u0026 Publishing Co., Inc. u00a0 u2022 u00a0 All Rights Reserved"
Буду очень благодарен за любую информацию о том, как обращаться с этими кодировками символов.
Подробнее здесь: https://stackoverflow.com/questions/793 ... php-plugin