Преобразование специальных символов, таких как ü и Ã, обратно в их исходные аналоги латинского алфавита в C#.C#

Место общения программистов C#
Ответить Пред. темаСлед. тема
Anonymous
 Преобразование специальных символов, таких как ü и Ã, обратно в их исходные аналоги латинского алфавита в C#.

Сообщение Anonymous »

Мне предоставили экспортированный файл из базы данных MySQL, кодировка которого, судя по всему, со временем несколько изменилась и содержит смесь кодов символов HTML, таких как & uuml;, и более проблемных символов, представляющих одни и те же буквы, такие как ü и Ã. Моя задача — вернуть файлу некоторую согласованность и записать все в правильные латинские символы, например. ú и ó.

Пример строки, с которой я имею дело:


Desinfektionslösungstücher für Flächen


Что должно соответствовать
50 Tattoo Desinfektionsl ö sungst ü cher f ü r Fl ä chen
50 Tattoo Desinfektionsl ö sungst ü cher f ü r Fl ä chen


Существует ли в C#/.Net 4.5 метод, который успешно перекодирует подобные ü и Ã в UTF-8 ?

Другой подход был бы целесообразным?

Также является символом абзаца ¶ в приведенном выше примере строка представляет собой фактический символ абзаца или часть какой-либо другой комбинации символов?

Я создал таблицу поиска на случай необходимости поиска и замены который приведен ниже, однако я не уверен, насколько он полон.

É -> É
“ -> "
†-> "
Ç -> Ç
à -> Ã
é, 'é
à -> ú -> ú
• -> -
Ø -> Ø
õ -> õ
í -> í
â -> â
ã -> ã
ê -> ê
á -> á
é -> é
ó -> ó
– -> –
ç -> ç
ª -> ª
º -> º
à -> à


Подробнее здесь: https://stackoverflow.com/questions/149 ... -latin-alp
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «C#»