Sparkling:基于Spark的PB级云数仓

邵赛赛

腾讯云    专家工程师

邵赛赛是腾讯云的专家工程师,主要专注于Spark领域,尤其是Spark core,Spark on Yarn和Spark Streaming。他是Apache Spark的Committer和Apache Livy的PMC。在腾讯之前,就职于大数据软件发行公司Hortonworks,专注于开源大数据领域。

演讲概要

在大数据领域,云原生应用已经成为了一种主流的趋势。相比于专有的数据中心,云为大数据应用提供了更强的可扩展性和更高的弹性,越来越多的传统数仓产品被云原生的数仓取代,比如AWS Redshift, Snowflake等等。Sparkling,它是基于Spark的一站式云数据仓库,提供了高可用性、伸缩性,同时拥有出众的性能。
1.介绍Sparkling云数仓的架构、实现;
2.性能上的改进;
3.介绍未来云数仓的演化。

听众收益

通过学习Sparkling云数仓的架构设计,了解到什么是数仓,数仓设计的难点以及如何使用或者研发云数仓。