2013-12-26 22:11:00
来 源
中存储网
Spark
SparkSummit以Shark、SparkStreaming及相关项目为主题,汇聚了Yahoo、Adobe、Intel、Amazon、RedHat、Databricks等众多知名IT企业的一线专家。

Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,立足于内存计算,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。Spark当下已成为Apache基金会的顶级开源项目,拥有着庞大的社区支持,技术也逐渐走向成熟,然而到真正投入企业生产,还需要经过许多优化。以Shark、Spark Streaming及相关项目为主题,Spark Summit邀请到了Yahoo、Adobe、Intel、Amazon、RedHat、Databricks等众多知名企业高管,分享Spark在企业内部的第一手实践。会议共两天,CSDN将其中精华演讲PPT整理汇总分三期发布,以飨读者。本期为第一部分。


CSDN推荐:欢迎免费订阅《Hadoop与大数据周刊》获取更多Hadoop技术文献、大数据技术分析、企业实战经验,生态圈发展趋势。


1. 加州大学伯克利分校AMP实验室博士Matei Zaharia:Spark的现状和未来

Matei Zaharia是加州大学伯克利分校AMP实验室博士研究生,Databricks公司的联合创始人兼现任CTO。Zaharia致力于于大规模数据密集型计算的系统和算法。研究项目包括:Spark、Shark、Multi-Resource Fairness、MapReduce Scheduling、SNAP Sequence Aligner,这次spark 峰会上他主要就 Spark的现状和未来做了详细的阐述。

2. Databricks公司CEO Ion Stoica:将数据转化为价值

Ion Stoica是UC Berkeley计算机教授,AMPLab共同创始人,弹性P2P协议Chord、集群内存计算框架Spark、集群资源管理平台Mesos都出自他。在Spark峰会上就如何将数据转化为价值做了阐述,主要针对数据量越来越大的问题。Databricks公司的目标就是建立下一代的大数据分析工具,Stoica 从诸多方面分析了Spark的优势。

3. 加州大学伯克利AMP实验室主任Mike Franklin:

AMP实验室的大数据研究

Mike Franklin,加州大学伯克利AMP实验室主任,在此次Spark峰会上就加州大学AMP实验室大数据研究团队、资源、成果和未来面临的挑战做了详细介绍。

4.Yahoo高级工程师Tim Tully :

集成Spark/Shark到雅虎数据分析平台

Tim Tully,Yahoo高级工程师,在这次Spark峰会上从Hadoop架构问题出发,反思其中的不足,通过对比雅虎以前的架构,解释雅虎未来的架构模式为什么会集成Spark/Shark,以及未来Shark的硬件条件和物理部署等情况。

5. 前雅虎Hadoop工程副总裁Eric Baldeschwieler:Spark在Hadoop生态系统中

Eric Baldeschwieler是前雅虎Hadoop工程的副总裁,Hortonworks的前CTO,一直是 Spark+Hadoop模式的积极呐喊者,此次峰会上他依然不改以往的本色,从雅虎使用Hadoop的历史,以及Spark的今天、优点等方面说明Spark+Hadoop模式是未来的趋势。

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。