日期:2014-05-17  浏览次数:20431 次

请问如何用正则表达式查找字符串下的特定词汇?

<div class="tit" style="float:left">企业名称:福州宏东远洋渔业有限公司<a
href="/company/company.php?comid=" target=_blank>查看公司详细介绍</a></span> <img src="/skin/system/group0.gif" alt="普通年会员" </div>

请问如何通过c#正则表达式获得企业名称下的“福州宏东远洋渔业有限公司”和alt下“普通年会员”这两个词。
我只截取的一部分html,企业名称整个页面这四个字只出现一次(可利用),但是alt频繁出现。
求教各位

------解决方案--------------------
(?is)<div\s*class="tit"[^>]*?>企业名称:(?<name>.*?)<a[^>]*?>.*?</a>.*?<img[^>]*?alt="(?<alt>[^"]+?)"/>\s*</div>
------解决方案--------------------
引用:
引用:(?is)<div\s*class="tit"[^>]*?>企业名称:(?<name>.*?)<a[^>]*?>.*?</a>.*?<img[^>]*?alt="(?<alt>[^"]+?)"/>\s*</div>
我的意思是获得“福州宏东远洋渔业有限公司”和alt下“普通年会员”这两个词

  string str = File.ReadAllText("D:\\1.txt", Encoding.Default);
            var m = Regex.Match(str, @"(?is)企业名称:(\w+).*?alt=[""']([^""']+)");
            Console.WriteLine(m.Groups[1].Value);
            Console.WriteLine(m.Groups[2].Value);