2016 年 1 月

第 31 卷,第 1 期

此文章由机器翻译。

编辑寄语 - 不成功,便成仁

通过 Michael Desmond |2016 年 1 月

Michael Desmond大数据是快速成为大型的业务,并因此生成大量的开发活动。提供的预报信息市场研究部队 Wikibon 项目该花在大型数据技术和服务将到达 49.28 亿美元在 2018年向上 27.36 亿美元在 2014 年。

自然而然,Microsoft 正在使开发人员在大型数据方案中。在 San Francisco 最后一年 4 月在 Build 大会上,该公司对于 Azure SQL Database 揭示 Azure 数据仓库、 Azure Data Lake 和弹性数据库等服务。当我们进入 2016年,这些努力都开始须自行承担取得成效的目标。其中解释了为什么 MSDN 杂志 》 本月的主题侧重于大型数据技术和开发。

Michael Rys,在他功能中,"使大型批处理分析更容易使用 U DATA-SQL,,"探索新 U SQL 语言,它结合 SQL 和 C# 的语义,以支持大型数据方案。接下来,Omid Afnan 演示如何收集、 分析和操作上连续的数据流实时在他的文章,"面向.NET 开发人员的实时数据分析使用 HDInsight。" 在组中,Gaurav Malhotra 的最后一篇"创建大数据管道使用 Azure Data Lake 和 Azure 数据工厂,,"将指导完成构建大数据管道使用 Azure 数据工厂将 Web 日志数据移到 Azure 数据 Lake 存储区,并处理该 Azure Data Lake 分析服务上使用 U SQL 脚本的数据。

为什么大数据和为什么要现在迁移? 作为 Afnan 说明 2015年是一大年,以便在 Microsoft 的大数据。

"虽然我们已经越来越内部多 exabyte 刻度我们的大数据方案中,我们附带提供了许多新功能在 Azure 中,"Afnan 说。"HDInsight 和版本的 Azure Data Lake 中的改进使大数据更加便捷面向开发人员。ADL 分析和存储允许开发人员专注于查询和聚合,在业务级别通过剥离分布式计算群集的复杂性和 map / reduce 下方的体系结构。"

他还指出,在 Visual Studio 工具来简化编码和调试 ADL 和 HDInsight 中的近期投入。尽管如此,Afnan 说开发人员部门面临着挑战,如在遇到"三个 V 的"大数据的周围陡峭的学习曲线 — 速度、 各种和卷 — 和分布式多阶段处理的空间中使用的模型。

"理想的起点是找到一种方法开始收集到大数据存储区,感兴趣的原始数据,然后开始浏览数据集、 获得真知灼见,并最终实施该过程,"他说。"减少的预备时间可以通过减少您需要管理的操作的数量。大数据遵循作业抽象的平台是肯定的好方法以避免业务举步维艰和放弃。"

Microsoft 致力于帮助开发人员部门从事这方面的挑战提供了工具和平台都公开和简化的新功能。这些设备包括说 Afnan,"的单个节点/顶点失败、 数据扭曲问题的浏览和分析的多个运行的同一个脚本的更复杂调试方案。"的新开发人员工具

没有多大数据空间中令人兴奋。我预计我们会有许多有关的详细信息大数据在我们的刊物上个月和数年内。


Michael Desmond是 MSDN 杂志的主编。