Изображение выше взято из Bing。
При переводе «微博» на корейский с помощью Microsoft интерфейс возвращает искаженный символ '웨이보(微��', потому что неизвестно, есть ли другие искаженные результаты перевода.
Могу ли я спросить, существует ли какой-либо код, который может автоматически отфильтровывать искаженные символы и сохранять их в базе данных? .
Как отфильтровать искаженный текст и оставить только «웨이보(微»?
Следующий код не может удалить искаженные символы:
Код: Выделить всё
$text = "웨이보(微��";
$output = mb_comvert_encoding ($text, 'utf-8', 'utf-8'); // output 웨이보(微��
$output = iconv ('UTF-8 ','UTF-8/IGNORE', $text); // output 웨이보(微��
$isRight = mb_check_decoding ($text);//it returned true.
$array = preg_split ('//u', $text);
var_dump($text);
array(9) {
[0]=>
string(0) ""
[1]=>
string(3) "웨"
[2]=>
string(3) "이"
[3]=>
string(3) "보"
[4]=>
string(1) "("
[5]=>
string(3) "微"
[6]=>
string(3) "�"
[7]=>
string(3) "�"
[8]=>
string(0) ""
}
Подробнее здесь: https://stackoverflow.com/questions/792 ... oss-in-php