C#正则表达式
Regex regexTitle = new Regex(@ "\ <title[^\> ]*\> \s*(? <Title> .*?)\s*\ </title\> ", RegexOptions.Compiled | RegexOptions.IgnoreCase);
Match m = regexTitle.Match(htmlData);
document.Title = m.Groups[ "Title "].Value;
其中htmlData是html文档
不懂正则表达式,查了一下,不明白中间(? <Title> .*?)是什么意思。还有后面m.Groups[ "Title "].Value。
很明显这个是为了取出html文档的title标签的值,但是为什么这么写呢?
请指点。谢谢^_^
------解决方案--------------------(? <Title> .*?)
()的意思是分组
? <Title> 的意思是给这个组起个名叫title ? <> 固定写法
.*?要匹配的内容