日期:2014-05-17  浏览次数:20945 次

正则表达式 提取 html 标签的内容
如  <span style=''>内容</span><img src=".."/>内容<p><input .../>内容</p> 只提取里面的 “内容”如果第一个有就提取第一个,如果第一个内容不存在就提取第二个“内容”,以此类推,不提取标签! 麻烦各位了! 

也就是获得 第一个内容!

------解决方案--------------------
 string str = File.ReadAllText("D:\\1.txt", Encoding.Default);
            str = Regex.Match(str, @"(?is)(?<=>)[^<>]+(?=<)").Value;
            Console.WriteLine(str);