日期:2014-05-18  浏览次数:20708 次

百度文库 文件存储问题,HELP~
在我们使用百度文库的时候,百度文库的那些文件是存在什么位置? 
  方式一:将各文件以二进制流的方式存储到数据当中,当用户查看文件的时候从数据库二进制流读出来,给用户显示。
  方式二:将文件直接保存在数据库本地硬盘上,只将存储的路径及文件名保存在数据库中,然后用户查看时,通过数据库获取文件路径及文件名,然后给用户显示。
  百度文库是应用那种方式啊?
   
  我们现在有个需求:
  每个用户都对应一个PDF文件,该PDF文件大小有10M左右,这样的用户有20万以上,需要满足用户查询指定PDF非常快,并且PDF能够通过IE浏览器快速的显示给用户就可以。这样的需求用什么方式存储比较好啊?

------解决方案--------------------
一般都是在硬盘上存文件
------解决方案--------------------
上述两种方式,要根据自己的实际情况来决定。第一种方案可以防止文件丢失或者损坏,并且通过数据库备份可以找回,但是确定就是数据库会变的比较的大;第二种方式简单,但是如果一不小心文件删掉或者损坏,或者其他情况,则不能正确访问倒数。
------解决方案--------------------
探讨

引用:

上述两种方式,要根据自己的实际情况来决定。第一种方案可以防止文件丢失或者损坏,并且通过数据库备份可以找回,但是确定就是数据库会变的比较的大;第二种方式简单,但是如果一不小心文件删掉或者损坏,或者其他情况,则不能正确访问倒数。


那两者之间的速度比较呢? 应该是存入数据库后会比较慢吧? 速度差别能有多大?

------解决方案--------------------
探讨

引用:
baidu文库不用数据库的说,直接用集群的文件系统存储和查找的,建议LZ看看HADOOP的相关资料。

根据目前项目情况,做不到集群效果啊?