日期:2014-05-20  浏览次数:20799 次

数据整合方案
数据库是异构的,分布到全国各省。想要一个有效的整合方案。做数据的大集中。
数据特点:
1、数据量大,一天400T左右(网络使用专线)
2、数据要传明细;(如果数据不集中明细,有什么让应用能实时访问省级数据)
3、应用做分析的时候,能实时访问到各省数据。

不知道什么样的产品或者技术能支撑?如果是程序是否可靠,需要在省里面部署什么样的程序?
如果是数据库什么样的数据库可以支持?数据库联邦是否可靠?

国内外有没有类似的Case?



------解决方案--------------------
各省只向中心发送统计数据,明细数据还是保存在各省,这样就不会出现400T数据传送的情况。数据尽可能少迁移,否则会出现数据不一致、数据的完整性等诸多问题。
------解决方案--------------------
1天400T


上次下载腾讯那数据库 仅仅QQ群 有150E差不多的数据 大小就40G

以上是估算的.

那么你有400T也就是400000G 也就是1,500,000E

150WE

如果每天24小时 也就是24*60*60=86400

并发应该是

150000000000000/86400=1736111111


也就是1秒传入17E数据,

我不关心你是如何整合的 我只关心 1秒中 17E的数据 是怎么进去的...


------解决方案--------------------
400T只是上传速度 上传速度应该比下载慢很多 我们假设是下载速度

一秒下载500MB应该是 86400*500=43200000MB=43200G 才40T

那么 你的上传速度应该是每秒5G

我要是有这么快的下载速度就牛逼了...看电影就应该不用缓冲了.
------解决方案--------------------
主要是担心 400T的数据 你扔在哪...有这么大的硬盘么?