Мне предоставили экспортированный файл из базы данных MySQL, кодировка которого, судя по всему, со временем несколько изменилась и содержит смесь кодов символов HTML, таких как & uuml;, и более проблемных символов, представляющих одни и те же буквы, такие как ü и Ã. Моя задача — вернуть файлу некоторую согласованность и записать все в правильные латинские символы, например. ú и ó.
Пример строки, с которой я имею дело:
Desinfektionslösungstücher für Flächen
Что должно соответствовать
50 Tattoo Desinfektionsl ö sungst ü cher f ü r Fl ä chen
50 Tattoo Desinfektionsl ö sungst ü cher f ü r Fl ä chen
Существует ли в C#/.Net 4.5 метод, который успешно перекодирует подобные ü и Ã в UTF-8 ?
Другой подход был бы целесообразным?
Также является символом абзаца ¶ в приведенном выше примере строка представляет собой фактический символ абзаца или часть какой-либо другой комбинации символов?
Я создал таблицу поиска на случай необходимости поиска и замены который приведен ниже, однако я не уверен, насколько он полон.
É -> É
“ -> "
†-> "
Ç -> Ç
à -> Ã
é, 'é
à -> ú -> ú
• -> -
Ø -> Ø
õ -> õ
à -> í
â -> â
ã -> ã
ê -> ê
á -> á
é -> é
ó -> ó
– -> –
ç -> ç
ª -> ª
º -> º
à -> à
Подробнее здесь: https://stackoverflow.com/questions/149 ... -latin-alp
Преобразование специальных символов, таких как ü и Ã, обратно в их исходные аналоги латинского алфавита в C#. ⇐ C#
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
.net MAUI Преобразование BindingContext обратно в исходные данные, содержащие объект
Anonymous » » в форуме C# - 0 Ответы
- 23 Просмотры
-
Последнее сообщение Anonymous
-