关于手册管理项目,大数据存储的疑问。
项目:手册管理控制项目
背景:手册的体积都比较大,每个手册平均在100-300M左右,大概有10000多份手册,增量为1000册/年。手册的格式为PDF或者WORD类型(DOC,DOCX),手册中有会有不少的图片。
数据库:SQL SERVER 2008 或者 ORACLE 10G / 11G
要求:将手册存储在数据库中。读取/编辑/版本控制
咨询:
想向大家了解一些信息,规避项目的风险。
1,手册存储在数据库中只能以二进制格式(TEXT,IMAGE,blob...)存储吗?还有其它的方式吗?二进制存储在图片和文字读取和编辑有什么弊端?
2,现在在架构设计上面,把手册的每一页拆分存储为数据库的每一条记录。并且手册的数据库和业务数据库分离。还有什么要考虑的吗?
3,在手册的操作方面。有没有第三方的组件可以采用。向大家征询一下文档管理的开源或者不开源的组件。ASP.NET和J2EE的都不限。
------解决方案--------------------数据库层面,用大对象 图片BLOB,大文本CLOB,索引加文本索引
注意,使用单独的表空间存储大对象,同时注意设置块大小(BLOCKSIZE)为16K或者32K,