Удалить теги HTML из строкиC#

Место общения программистов C#
Anonymous
 Удалить теги HTML из строки

Сообщение Anonymous »

Как лучше всего удалить теги HTML из строки, где эта строка может содержать больше и меньше, чем знаки? < /p>
Пример строки < /p>
Hello two is < three but three is > one"
< /code>
ожидаемый ответ < /p>
"Hello two is < three but three is > one"
< /code>
Я попробовал это, но он удаляет «три, но три - это», что не может произойти < /p>
Regex.Replace(b, "", String.Empty);

html Encode/Decode - это опция, но последняя среда. Мой текущий ответ состоит в том, чтобы создать конкретный список тегов HTML и сделать строку разделение или строку заменить тип вещей. Какой самый лучший способ справиться с этой ситуацией? < /P>
Решение: < /p>
Html.Scrub(html);

public static class Html
{
public static string Scrub(string s)
{
HtmlDocument d = new HtmlDocument();
d.LoadHtml(s);
return d.DocumentNode.InnerText;
}
public static string Scrub(string s, HtmlDocument d)
{
d.LoadHtml(s);
return d.DocumentNode.InnerText;
}
}
< /code>
Таким образом позволил мне пройти через все струнные реквизиты объекта: < /p>
HtmlDocument d = new HtmlDocument();
foreach (var eItem in eItems)
{
eItem.string1 = Html.Scrub(eItem.string1, d);
eItem.string2 = Html.Scrub(eItem.string2, d);
eItem.string3 = Html.Scrub(eItem.string3, d);


Подробнее здесь: https://stackoverflow.com/questions/794 ... rom-string

Вернуться в «C#»