c# 正则删除 html代码,.NET(C#)用正则表达式清除HTML标签(包括script和style),保留纯本文...

#region 去掉HTML中的所有标签,只留下纯文本

///

/// 去掉HTML中的所有标签,只留下纯文本

///

///

///

public static string CleanHtml(string strHtml)

{

if (string.IsNullOrEmpty(strHtml)) return strHtml;

//删除脚本

//Regex.Replace(strHtml, @"", "", RegexOptions.IgnoreCase)

strHtml = Regex.Replace(strHtml, "(\, "", RegexOptions.IgnoreCase | RegexOptions.Singleline);

//删除标签

var r = new Regex(@"?[^>]*>", RegexOptions.IgnoreCase);

Match m;

for (m = r.Match(strHtml); m.Success; m = m.NextMatch())

{

strHtml = strHtml.Replace(m.Groups[0].ToString(), "");

}

return strHtml.Trim();

}

#endregion