日期:2013-03-17  浏览次数:20495 次

第一种方法:利用AltaVista搜索引擎来实现

这种方法是检查与你的站点链接的数目。这里用AltaVista搜索引擎来实现。在这里,我们用如下搜索引擎:
http://www.altavista.com/cgi-bin/query?kl=XX&pg=q&text=yes&q=link%3A&search=Search。
这是AltaVista的一个文本版本。这样可以节省我们大量的需要解析HTML的代码。接着,我们使用rawurlencode()来处理我们确切的URL保证Altavista能够正确地处理它。处理如下:

$url = "http://www.oso.com.cn";
$url_encoded = rawurlencode($url);
$url_to_check = "http://www.altavista.com/cgi-bin/query?
kl=XX&pg=q&text=yes&q=link%3A$url_encoded&search=Search";

  这样,我们可以通过file()函数回取URL了。

$num_searched = file($url_to_check);

  现在我们所取回的文件已经存放在数组$num_searched中。现在要在数组中查找我们想要的文本"About (.*)
pages found. "。(.*)表示在任何东西。而且,如果没有人链接我们的URL,AltaVista将显示"AltaVista found
no document matching your query."。因为我们想知道多少个人正在与我们的URL进行着链接,那段文本将被看
作0个人链接。

$url = "http://www.oso.com.cn";
$url_encoded = rawurlencode($url);
$url_to_check =
"http://www.altavista.com/cgi-bin/query?kl=XX&pg=q&text=yes&q=link%3A$url_encoded&search=Search";

$num_searched = file($url_to_check);
for ($i = 0; $i < count($num_searched); $i++) {
if(eregi( "About (.*) pages found.", $num_searched[$i])){
$total_links = eregi_replace( "

About (.*) pages found.", "1", $num_searched[$i]);
}
elseif(eregi( "AltaVista found no document matching your query.",$num_searched[$i])){
$total_links = "0";
}
}


  这样,我们可以通过打印语句得到我们的查找结果了:
print("$total_links people are linking to $url");


第二种方法:利用MYSQL数据库以下是我转贴的一篇文章,来自于PHP中文用户,起方式是利用临时数据表处理当前连接,具体内容如下:

***************************************************************
首先,用MySQL的工具建一个表:

CREATE TABLE ccol(
id integer not null auto_increment, #记录的ID
ip char(15) not null, #访问者的IP地址
dtstamp datetime not null, #最后访问时间
uri char(255), #访问者请求的URI
primary key (id)
);

然后,写一段PHP代码:


/*
文件:ccol.php - ConCurrent OnLine statistics
目的:统计同时在线浏览的人数
作者:Hunte, hunte@phpuser.com
修改:2000-4-25
*/

$duration=1800;
require "db.php";
//包含DBSQL,详情可以参考我的另一篇文章
$ccol=new dbSQL;
$ccol->connect();
$ccol->query("DELETE FROM ccol WHERE
(UNIX_TIMESTAMP(NOW())-UNIX_TIMESTAMP(dtstamp))>$duration");
//删除超过半小时的记录
$ccol->query("SELECT * FROM ccol WHERE ip="$REMOTE_ADDR"");
//判断当前的IP是否在该表中存在
if ($ccol->nf())//有?
{
$ccol->next_record();//下移找到的记录数组的指针
$id=$ccol->f("id");
$ccol->query("UPDATE ccol SET dtstamp=now(), uri="$REQUEST_URI" WHERE id=$id");
//设置最后访问时间和访问页面
}
else//没有
{
$ccol->query("INSERT INTO ccol VALUES (0, "$REMOTE_ADDR", now(), "$REQUEST_URI")");
}

$ccol->query("SELECT COUNT(*) AS ccol FROM ccol WHERE
(UNIX_TIMESTAMP(NOW())-UNIX_TIMESTAMP(dtstamp))<=$duration");
//找出在半个小时内的记录,后面的WHERE子句可有可无--超出时间的已经被删除了
$ccol->next_record()
echo "在线人数:", $ccol->f("ccol");
$ccol->free_result();

怎么用呢?在站点的每个页面的上面调用这个程序.


当然,这段代码还有改进的余地。例如,在每次调用是都要删除半小时前的记录,这是没有必要而且会降低效率。
可以一个什么办法过更长的时间再做,比如6小时。大家自个儿想想吧,我就不说了。

这种方法只要稍做修改,就可以派上别的用处,如SESSION的管理、网站的访问统计分析等。