今天面试题目:百度,GOOGLE,搜狐,网易,新浪使用什么数据库?
今天面试题目
1.百度,GOOGLE,搜狐,网易,新浪使用什么数据库?
2.如何更有效处理百万级数量,用数据库还是XML直接存储在硬盘上?
----------------
大家如何说?
等下吃完饭公布答案...
------解决方案--------------------up
------解决方案--------------------Oracle吧
------解决方案--------------------oracle+sqlserver
------解决方案--------------------有种说法是百度,GOOGLE用自己的文件系统,不过我也不知道
------解决方案--------------------Oracle
------解决方案--------------------我不知道,但我想知道。。。
------解决方案--------------------期待 .......
------解决方案--------------------答案是什么.这个又不是他们公司内部的,怎么会知道了,再说是内部的话有的也是机密
------解决方案--------------------考官给出的答案是
1.百度,google和门户网站没有数据库,直接使用文件存储在服务器上
2.用XML直接存储在硬盘上。因为数据库有连接节点
我对上面的看法有点不认同。百度,GOOGLE搜索引擎为了提交检索效率可能没有使用数据库(事实上也是如此)。门户网站应该有自己的数据库
第二个问题我觉的应该是数据库比较快。XML传输的效率并不怎么好或者可以说比较差
下面的有不同意见么?
------解决方案--------------------1,个人觉得,百度,google应该有数据库,应该是N*N台,但查找时不直接搜索数据库,而是后台生成索引文件,然后按分词查找索引文件。
2,如果用XML做数据库,百度,google的数据库文件N*N*N大。xml做数据库是非常占内存的。所以本人觉得不太可能。
以上本人愚见,如果不对请高人指点
------解决方案--------------------搜索引擎不适合用关系型数据库。目前的数据库基本都是关系型的
几乎可以肯定的是GOOGLE如此庞大的数据量是没有存储在数据库里的而是以某种文件格式直接存放在硬盘上
但门户网站呢?
也是如此?
------解决方案--------------------交白卷,哈
LZ 应聘啥公司可否透露一点?
------解决方案--------------------google用的google file system,存储的是big table,有很多论文是关于这个的
搜索直接从索引中拿
百万级的数据用数据库,比如oracle效率就很好啊,建立索引,视图来优化
我觉得xml浪费内存,效率不见得多好
------解决方案--------------------学习
------解决方案--------------------关注
------解决方案--------------------这种大网站应该会自己定制一些专用性比较强的数据库吧,例如,我一同学在诺基亚搞开发,他们现在用的数据库就是好像叫NOKIA DB3.0的,是向微软定制的专用性比较强,有自己公司特色的一个数据库。
大公司应该有自己的特色,不能入俗,就算真用了Oracle或其它什么的也要换个名称换个门面。
呵呵。
------解决方案--------------------顶 高人上
------解决方案--------------------那个答案有点扯淡,反着正着说都“对”,但是又都“不对”,是混淆视听的。
关系数据库的数据保存在哪里?难道不是“文件存储在服务器上”么?当然是。它们并不是使用咒语把数据保存在水晶球里。那么,它们难道不使用数据处理程序来读写数据么?当然也使用,否则要文件当花欣赏呀。只不过,它们可能没有使用商用关系数据库管理程序,而是使用别的嵌入数据库管理程序。我们可以想见,Google的分布式数据库系统比任何一个商用的关系数据库系统都不差,甚至可能功能更强。
第二个问题与第一个相关。考官把数据库系统藐视成一个毫不值得重视的小程序,也就只能“只见文件格式不见数据库管理系统了”。
------解决方案--------------------它们难道不使用数据处理程序来读写数据么 --> google等难道不使用数据处理程序来读写数据么
------解决方案--------------------1.百度,GOOGLE,搜狐,网易,新浪使用什么数据库?
答:这些公司根本不用数据库。因为google曾经公布他们的核心机密:通过鸽子快速查阅电脑来对数据进行告诉查询汇总。
呵呵,这是google在某年4月1ri开的“官方”玩笑。
不过第二个问题的“标准”答案确实有点扯淡,有些类型的信息用直接文件系统粗放较好,有一些还是用数据库较好。