怎么获取HTML字段中，所有URL地址（过滤掉其它所有）-ASP.NET教程-爱易网页

怎么获取HTML字段中，所有URL地址（过滤掉其它所有）

日期：2014-05-18　浏览次数：20622 次

如何获取HTML字段中，所有URL地址（过滤掉其它所有）
如何获取HTML字段中，所有URL地址（过滤掉其它所有）

------解决方案--------------------
用正则表达式
------解决方案--------------------
TextBox2.Text = " ";
string web_url = this.TextBox1.Text;// "http://blog.csdn.net/21aspnet/ "
string all_code = " ";
HttpWebRequest all_codeRequest = (HttpWebRequest)WebRequest.Create(web_url);
WebResponse all_codeResponse = all_codeRequest.GetResponse();
StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream());
all_code = the_Reader.ReadToEnd();
the_Reader.Close();
ArrayList my_list = new ArrayList();
string p = @ "http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)? ";
Regex re = new Regex(p, RegexOptions.IgnoreCase);
MatchCollection mc = re.Matches(all_code);

for (int i = 0; i <= mc.Count - 1; i++)
{
bool _foo = false;
string name = mc[i].ToString();
foreach (string list in my_list)
{
if (name == list)
{
_foo = true;
break;
}
}//过滤

if (!_foo)
{
TextBox2.Text += name + "\n ";
}
}

------解决方案--------------------
MatchCollection matchs = Regex.Matches(HTML,@ " <a> (? <url> [^ <]*) </a> ", RegexOptions.IgnoreCase);
------解决方案--------------------
foreach (Match m in matchs)
{
str += m.Groups[ "url "].Value;
}
------解决方案--------------------
＜a href=[^ <]*>

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

简单的SELECT取值有关问题

跪求大神指导关于Ext的有关问题

想在静态方法中施用服务器控件

反射发送实战（－）_Asp.NET Framework

初学,怎么从这样的格式中取出数据

怎么将一个表中的某一行数据写入另一个表中

前面讨论静态和实例的函数的性能有关问题，今天又有一个疑惑，希望大家指教

刚学ASP.NET,提个有关问题

ASP.Net网站发布有关问题.相对路径有关问题

怎么获取HTML字段中，所有URL地址（过滤掉其它所有）

相关资料更多>

推荐阅读更多>