怎么获取HTML字段中，所有URL地址（过滤掉其它所有）-ASP.NET教程-爱易网页

怎么获取HTML字段中，所有URL地址（过滤掉其它所有）

日期：2014-05-18　浏览次数：20812 次

如何获取HTML字段中，所有URL地址（过滤掉其它所有）
如何获取HTML字段中，所有URL地址（过滤掉其它所有）

------解决方案--------------------
用正则表达式
------解决方案--------------------
TextBox2.Text = " ";
string web_url = this.TextBox1.Text;// "http://blog.csdn.net/21aspnet/ "
string all_code = " ";
HttpWebRequest all_codeRequest = (HttpWebRequest)WebRequest.Create(web_url);
WebResponse all_codeResponse = all_codeRequest.GetResponse();
StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream());
all_code = the_Reader.ReadToEnd();
the_Reader.Close();
ArrayList my_list = new ArrayList();
string p = @ "http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)? ";
Regex re = new Regex(p, RegexOptions.IgnoreCase);
MatchCollection mc = re.Matches(all_code);

for (int i = 0; i <= mc.Count - 1; i++)
{
bool _foo = false;
string name = mc[i].ToString();
foreach (string list in my_list)
{
if (name == list)
{
_foo = true;
break;
}
}//过滤

if (!_foo)
{
TextBox2.Text += name + "\n ";
}
}

------解决方案--------------------
MatchCollection matchs = Regex.Matches(HTML,@ " <a> (? <url> [^ <]*) </a> ", RegexOptions.IgnoreCase);
------解决方案--------------------
foreach (Match m in matchs)
{
str += m.Groups[ "url "].Value;
}
------解决方案--------------------
＜a href=[^ <]*>

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

关于Repeater 的三层嵌套有关问题感兴趣的哥哥姐姐请看看！

在.NET中怎么实现对视图中的一个表进行增删改

enum与dropdownlist合用的相关有关问题

// 当用户输入ctrl + enter 时候，小弟我把它模拟成 enter 操作

请教怎么获取ascx里导入的其他的ascx的控件的值

一段找出URL的代码（C#）_Asp.NET开发实例

一个由数据库生成menu有关问题

Web站点占满CPU的有关问题

怎么获取HTML字段中，所有URL地址（过滤掉其它所有）

相关资料更多>

推荐阅读更多>