日期:2014-05-17  浏览次数:20647 次

微软展开“大数据”蓝图,推进Hadoop至Azure和Windows Server

原文 http://www.iteye.com/news/23045

?

微软已经展开了他们的“大数据”蓝图,其中担当主要角色的就是Apache Hadoop。

?

Hadoop是一个分布式系统基础架构,由Apache基金会开发。它是一个能够对大量数据进行分布式处理的软件框架。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。

在12日西雅图召开的微软PASS(Professional?Association for SQL Server,SQL Server专家协会) Summit会议上,微软公司副总裁Ted Kumert描绘了这一蓝图。Ted Kumert表示,该蓝图“旨在帮助用户管理及分析任何大小、任何位置(包括固定地址或在私有及公共云上)的所有数据”。

Ted Kunment同时透露,下一版本的SQL Server (代号Denali)已正式命名为SQL Server 2012。在Kunment提供路线图中的一项计划就是,将SQL Server 2012并入Hadoop分布式计算平台,以及将Hadoop引入Windows Server和Azure(微软的云服务)。

也就是说,运行SQL Server的微软客户将通过Hadoop的引入获得真正的大数据处理能力。微软此前发布了早期代码,让客户可以将这个Java架构接入到SQL Server 2008 R2、SQL Server Parallel Data Warehouse以及新的SQL Server 2012数据库。SQL Server 2012将在明年上半年推出。

微软的开放源代码社交资深总监Gianugo在博客中写道:

?

基于Hadoop的Windows Azure服务可以让开发人员和用户直接在Azure云上提交及运行Hadoop作业,从而带来简单的用户体验。

我们一直致力提供一个简单的下载、安装及配置Hadoop相关技术的体验,包括HDFS、Hive以及Pig,以帮助企业接受Hadoop。

对于开发人员,我们则将在微软开发者工具中集成该技术,同时我们将为大数据投资JavaScript,打造它的第一流语言位置。最终将实现使用JavaScript来编写高性能的Map/Reduce作业。没错,Javascript Map/Reduce。


今天八月的Data Warehousing Institute会议上,微软曾推出了一个基于Sqoop(SQL-to-Hadoop,一个在Hadoop和关系型数据库间进行数据导入导出工具)的SQL Server Hadoop连接器的预览版本。目前该连接器也正式发布了。