数据整合方案
数据库是异构的,分布到全国各省。想要一个有效的整合方案。做数据的大集中。
数据特点:
1、数据量大,一天400T左右(网络使用专线)
2、数据要传明细;(如果数据不集中明细,有什么让应用能实时访问省级数据)
3、应用做分析的时候,能实时访问到各省数据。
不知道什么样的产品或者技术能支撑?如果是程序是否可靠,需要在省里面部署什么样的程序?
如果是数据库什么样的数据库可以支持?数据库联邦是否可靠?
国内外有没有类似的Case?
------解决方案--------------------各省只向中心发送统计数据,明细数据还是保存在各省,这样就不会出现400T数据传送的情况。数据尽可能少迁移,否则会出现数据不一致、数据的完整性等诸多问题。
------解决方案--------------------1天400T
上次下载腾讯那数据库 仅仅QQ群 有150E差不多的数据 大小就40G
以上是估算的.
那么你有400T也就是400000G 也就是1,500,000E
150WE
如果每天24小时 也就是24*60*60=86400
并发应该是
150000000000000/86400=1736111111
也就是1秒传入17E数据,
我不关心你是如何整合的 我只关心 1秒中 17E的数据 是怎么进去的...
------解决方案--------------------400T只是上传速度 上传速度应该比下载慢很多 我们假设是下载速度
一秒下载500MB应该是 86400*500=43200000MB=43200G 才40T
那么 你的上传速度应该是每秒5G
我要是有这么快的下载速度就牛逼了...看电影就应该不用缓冲了.
------解决方案--------------------主要是担心 400T的数据 你扔在哪...有这么大的硬盘么?