У меня есть тестовый сайт, на котором все время используется Windows-1252. Им действительно нужны/используются некоторые символы, такие как символ квадратного корня. И им нет необходимости отображать информацию на другом языке, кроме английского. Недавно меня попросили переключить его на UTF-8 из-за некоторых проблем безопасности. После того, как я изменил его на UTF-8, квадратные корни и другие символы (которые извлекаются из базы данных Oracle и передаются через ColdFusion) будут нормально отображаться на полученной веб-странице. Однако, если я снова сохранил документ (опубликовал в БД, страница обновилась), символы превратились в странные символы. Если бы я сохранился еще раз, появились бы еще более странные символы. Итак...
Если мне не нужно ничего, кроме английского, есть ли что-то плохое в том, чтобы придерживаться Windows-1252? Есть ли какие-либо проблемы с безопасностью/взломом?
Есть ли какие-либо последствия НЕ использования UTF-8, если вы используете
HTML5 (поскольку это кодировка по умолчанию для HTML5)?
Если мне рекомендуется переключиться на UTF-8, как мне заставить работать
сохраненные символы квадратного корня (и другие символы)?
Я уже читал все эти страницы, все еще с небольшими трудностями в понимании всего этого. Надеюсь, кто-то здесь и поможет мне прояснить ситуацию. Спасибо!
Отличное описание того, как появилась UTF-8, почему она замечательная и какие проблемы она решает…
http://www.w3.org/International/questio ... -encodings «Используйте UTF-8, если можете». «На самом деле в проекте спецификации HTML5 в настоящее время говорится: «Авторам рекомендуется использовать UTF-8. Специалисты по проверке соответствия могут посоветовать авторам не использовать устаревшие кодировки. Инструменты разработки должны по умолчанию использовать UTF-8 для вновь создаваемых документов».
Я ценю всю вашу помощь, которая помогла мне понять это. Я упрощу исходные три вопроса, так что, надеюсь, можно будет получить четкий ответ, и вот он: клиенту не нужна поддержка других языков, он будет использовать некоторые теги HTML5 и ТОННУ трафика JSON/XML, отправляемого туда и обратно через jQuery.ajax(). Учитывая эту информацию, с точки зрения безопасности, есть ли что-то неправильное в том, чтобы для базы данных было установлено значение NLS_CHARACTERSET: WE8MSWIN1252, а для веб-страниц - значение ? Спасибо.
Вот еще один вопрос, который немного отличается от этого: почему я могу использовать символ, который не является частью кодировки (windows-1252)?.
У меня есть тестовый сайт, на котором все время используется Windows-1252. Им действительно нужны/используются некоторые символы, такие как символ квадратного корня. И им нет необходимости отображать информацию на другом языке, кроме английского. Недавно меня попросили переключить его на UTF-8 из-за некоторых проблем безопасности. После того, как я изменил его на UTF-8, квадратные корни и другие символы (которые извлекаются из базы данных Oracle и передаются через ColdFusion) будут нормально отображаться на полученной веб-странице. Однако, если я снова сохранил документ (опубликовал в БД, страница обновилась), символы превратились в странные символы. Если бы я сохранился еще раз, появились бы еще более странные символы. Итак...
[list] [*]Если мне не нужно ничего, кроме английского, есть ли что-то плохое в том, чтобы придерживаться Windows-1252? Есть ли какие-либо проблемы с безопасностью/взломом? [*]Есть ли какие-либо последствия НЕ использования UTF-8, если вы используете HTML5 (поскольку это кодировка по умолчанию для HTML5)? [*]Если мне рекомендуется переключиться на UTF-8, как мне заставить работать сохраненные символы квадратного корня (и другие символы)? [/list]
Я уже читал все эти страницы, все еще с небольшими трудностями в понимании всего этого. Надеюсь, кто-то здесь и поможет мне прояснить ситуацию. Спасибо!
[list] [*]https://www.owasp.org/index.php/Canonicalization,_locale_and_Unicode [*][b]Отличное описание того, как появилась UTF-8, почему она замечательная и какие проблемы она решает…[/b] [youtube]MijmeoH9LT4[/youtube] [*]http://www.w3.org/International/questions/qa-choosing-encodings «Используйте UTF-8, если можете». «На самом деле в проекте спецификации HTML5 в настоящее время говорится: «Авторам рекомендуется использовать UTF-8. Специалисты по проверке соответствия могут посоветовать авторам не использовать устаревшие кодировки. Инструменты разработки должны по умолчанию использовать UTF-8 для вновь создаваемых документов». [*]http://www.w3schools.com/tags/ref_charactersets.asp «Для HTML5 кодировкой символов по умолчанию является UTF-8». [*]http://www.joelonsoftware.com/articles/Unicode.html [/list]
[b]* * * ОБНОВЛЕНИЕ * * *[/b]
Я ценю всю вашу помощь, которая помогла мне понять это. [b]Я упрощу исходные три вопроса, так что, надеюсь, можно будет получить четкий ответ[/b], и вот он: клиенту не нужна поддержка других языков, он будет использовать некоторые теги HTML5 и ТОННУ трафика JSON/XML, отправляемого туда и обратно через jQuery.ajax(). Учитывая эту информацию, с точки зрения безопасности, есть ли что-то неправильное в том, чтобы для базы данных было установлено значение NLS_CHARACTERSET: WE8MSWIN1252, а для веб-страниц - значение ? Спасибо.
Вот еще один вопрос, который немного отличается от этого: почему я могу использовать символ, который не является частью кодировки (windows-1252)?.