日期:2014-05-17  浏览次数:20441 次

php 从字符串中截取url的问题
大家好,首先,我不会php,但是有个php的问题希望大家能帮我解决下,万分感谢

我从一个php程序中调出一个字符串$longurl

这个$longurl echo 的结果是
www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>

如何截取www.csdn.net/123456 这一段呢

我在网上找的结果是

$aa = $longurl;
preg_match("/http[^\"]*/",$aa,$bb);
echo $bb[0];

但是下一段程序 我用的百度短网址api想缩短

程序是

$urlbd = '$bb[0]';
$result = getBaiduShortUrl($urlbd);
if ($result) {
echo '成功:'.$result;
} else {
die('失败');
}

function getBaiduShortUrl($urlbd) {
$data = array(
'url' => $urlbd,
);
$baidu_url = 'http://dwz.cn/create.php';
$ret = postData($baidu_url, $data);
if ($ret) {
$ret = json_decode($ret, true);
if ($ret['status'] !== 0) {
return false;
} else {
return $ret['tinyurl'];
}
} else {
return false;
}
}


function postData($urlbd, $data) {
  $options = array(
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_HEADER => false,
  CURLOPT_FOLLOWLOCATION => true,
  CURLOPT_ENCODING => 'gzip,deflate,sdch',
  CURLOPT_USERAGENT => 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.1 (KHTML, like Gecko) Ubuntu/11.10 Chromium/14.0.835.202 Chrome/14.0.835.202 Safari/535.1',
  CURLOPT_AUTOREFERER => true,
  CURLOPT_CONNECTTIMEOUT => 120,
  CURLOPT_TIMEOUT => 120,
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_REFERER => 'http://www.baidu.com/',
  CURLOPT_POSTFIELDS => $data,
  );  

  $ch = curl_init($urlbd);
  curl_setopt_array($ch, $options);
  $content = curl_exec($ch);
  $err = curl_errno($ch);
  $errmsg = curl_error($ch);
  $header = curl_getinfo($ch);
  curl_close($ch);
   
  return $content;
}


 缩短的地址怎么也不对 请大家帮我看下好吗 


------解决方案--------------------
你那个正则取不到你想要的那段吧 还有 $urlbd = '$bb[0]'; 你这样子定义 $urlbd的值就是$bb[0]这一个字符串
要用双引号才会解析里面的变量 换成下面的
preg_match("/<a href=http:\/\/([^\"]+)[^<>]*>.*<\/a>/i", $aa, $bb);
$urlbd = $bb[1];
------解决方案--------------------
刚csdn 又怂了.

如何截取www.csdn.net/123456 这一段呢

你是要从 www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a> 
提取www.csdn.net/123456 ?

如果是的话那可不是什么缩短网址. 方法有很多,我不清楚你还有没有其他的网址情况出现,暂时这么写吧
$str='www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>';
preg_match('/^([a-z\d\.\/]+)<a/i',$str,$match);
$urlStr=$match[1];
echo $urlStr;
结果
www.csdn.net/123456

------解决方案--------------------
www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>
若需要截取的字符都是$s1<a ....这样的话,有必要用正则吗?
用$strArray = explode("<a", $str);分隔,这样不行吗?
------解决方案--------------------
我的意思是:
我从一个php程序中调出一个字符串$longurl

这个$longurl echo 的结果是
www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>
这个中的 $longurl 字符串是不是都是 {url地址<a>...</a>}这样的规律啊!是的话就可以用php的字符串分隔函数去分隔它,然后返回一个数组:
$strArray = explode("<a", $longurl);
print_r($strArray);

你在看看结果是咋样吧