Проблемы с кодировкой символов в плагине WordPress PHPPhp

Кемеровские программисты php общаются здесь
Ответить
Anonymous
 Проблемы с кодировкой символов в плагине WordPress PHP

Сообщение Anonymous »

Я пытаюсь написать плагин WordPress для извлечения строки об авторских правах по URL-адресу веб-сайта. Строка, содержащаяся на HTML-странице данного веб-сайта:

Код: Выделить всё

"© 2024   •   Printing & Publishing Co., Inc.   •   All Rights Reserved"
и в моем плагине PHP он закодирован как:
"u00a9 2024 u00a0 u2022 u00a0 Printing & Publishing Co., Inc. u00a0 u2022 u00a0 Все Права защищены»
Это выглядит как кодировка UTF-16 без начальных «\" или «0x». Конфигурация расширения iconv, возвращаемая iconv_get_encoding:

Код: Выделить всё

[input_encoding] => UTF-8
[output_encoding] => UTF-8
[internal_encoding] => UTF-8
В HTML-коде веб-сайта указан набор символов charset="UTF-8".
Я пробовал всевозможные варианты html_entity_decode. , mb_convert_encoding и даже сопоставление регулярных выражений для "'/u([0-9a-fA-F]{4})/'" для перехвата этих, казалось бы, символов в кодировке UTF-16, но все безрезультатно. Я продолжаю получать:

Код: Выделить всё

"u00a9 2024 u00a0 u2022 u00a0 Printing & Publishing Co., Inc. u00a0 u2022 u00a0 All Rights Reserved"
или

Код: Выделить всё

"u00a9 2024 u00a0 u2022 u00a0 Printing u0026 Publishing Co., Inc. u00a0 u2022 u00a0 All Rights Reserved"
в зависимости от того, использовал ли я html_entity_decode или нет.
Буду очень благодарен за любую информацию о том, как обращаться с этими кодировками символов.

Подробнее здесь: https://stackoverflow.com/questions/793 ... php-plugin
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Php»