日期:2014-05-19  浏览次数:20909 次

想开发一个搜索引擎,大师级精英高手请进来看看,只要是有水准的答案一律给分
我想开发一个搜索引擎,主要是针对搜索某一类有价值的信息,例如:搜索有关汽车的信息,先不要给我说不可能实现,我相信自己的命运由自己创造,请大家给我点思路,有水准的答案一律给分。本人精通C#,Javascript,SQl,大师级别说不上,AJAX入门级别,不过现在要做个东西只要是能想出来的就能做出来。最好是这几门技术能派上用场的技术。

------解决方案--------------------
我现在的公司正在研究这个,主要技术包括分词,蜘蛛等方面的知识,网上也有开源的代码:
http://gforge.osdn.net.cn/projects/xunlong/
------解决方案--------------------
做个演示性的倒是不难,不过要用于商业用途,则做起来很麻烦
大部分无非跟算法、数据结构相关,与用什么语言真没什么太大关系。
提供一个简单方案,用google的API查到相关数据后,再进行过滤。呵呵
------解决方案--------------------
去学一下B树结构。
------解决方案--------------------
去网上下开源的搜索引擎研究
------解决方案--------------------
.net 有dotlucene java 有lucene,都是很好
------解决方案--------------------
其实搜索引擎的原理倒不是很难,三个部分,网络蜘蛛,预处理(包括索引和排序),提供服务...

要做一个简单的演示系统没什么说的,很好实现,但是要作为商业用途,那就得花功夫研究一下了,里面很多点都很值得研究,比如如何提高网络蜘蛛的抓取网页的效率,如何进行索引,如何进行排序(比如google用的pagerank)....现在每一个点都有很多人在研究...

楼主可以看看网上开源的一些搜索引擎的例子,最经典的应该是apache项目下的nutch和lucene,nutch是一个完整的搜索引擎,它是基于lucene的,lucence只是一个全文索引的一个函数库,不是完整的应用程序...nutch在索引阶段调用了lucene的一些API...

可以好好研究一下这两个....然后在此基础上有所创新和突破,用C#做出你自己的搜索引擎来(nutch和lucene都是用java写的)...

我现在也刚接触搜索引擎,以上言论仅供参考...
------解决方案--------------------
有一个仁兄,开发了叫
迅龙的中文搜索引擎,功能很强大
而且代码是开源的
你到网上搜一下
http://gforge.osdn.net.cn/projects/xunlong/
------解决方案--------------------
leixueqiyi() ( ) 信誉:100 Blog 2007-03-27 09:23:07 得分: 0


有一个仁兄,开发了叫
迅龙的中文搜索引擎,功能很强大
而且代码是开源的
你到网上搜一下
http://gforge.osdn.net.cn/projects/xunlong/


----------------------------------------------
mark