spArk strEAming

《Spark Streaming技术内幕及源码剖析》是2017年5月1日出版的图书,作者是王家林、夏阳。图书简介 本书以大数据处理引擎Spark的稳定版本1.6.x为基础,从应用案例、原理、源码、流程、调优等多个角度剖析Spark上的实时计算框架SparkStreamin

《Learning Real Time processing with Spark Streaming》是Packt Publishing出版的图书,作者是Sumit Gupta 内容简介 Building scalable and fault-tolerant streaming applications made easy with Spark streaming About This Book Proces

《Spark Streaming实时流式大数据处理实战》是2019年4月机械工业出版社出版的图书,作者是肖力涛 。内容简介 本书以翔实的原理讲解和充实的实战代码剖析,全面阐述了Spark Streaming流式处理平台,便于读者能够从入门开始了解搭建Spark平台,

两位作者Gerard Maas和Farancois Garillot将带你探索Apache Spark的理论基础知识。本书通过两个部分对比了Spark(现在支持的两种流API的差异:原始Spark Streaming库和新的结构化流API。学习基本的流处理概念并研究不同的流体系结构 通过

内存计算下,Spark 比 Hadoop 快100倍。易用性 Spark 提供了80多个高级运算符。通用性 Spark 提供了大量的库,包括Spark Core、Spark SQL、Spark Streaming、MLlib、GraphX。 开发者可以在同一个应用程序中无缝组合使用这些库。支持多

第1章 Spark及其生态圈概述1.1 Spark简介1.1.1 什么是Spark1.1.2 Spark与MapReduce比较1.1.3 Spark的演进路线图1.2 Spark生态系统1.2.1 Spark Core1.2.2 Spark Streaming1.2.3 Spark SQL

本书详细阐述了实时大数据分析的实现过程,主要包括大数据技术前景及分析平台;熟悉Storm平台;用Storm处理数据;Trident介绍和Storm性能优化;熟悉Kinesis;熟悉Spark;RDD编程;Spark的SQL查询引擎;Spark Streaming分析流数据以及Lambda架构等内容。

3.6 使用Spark SQL进行数据探索 102 3.7 小结 107 第4章 Spark流处理:Spark Streaming 与Structured Streaming 108 4.1 一个Spark Streaming流处理的例子 109 4.2 消息送达保证 110 4.3 Google MillWheel系统和Google Dataflow模型 114

本书以Scala作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Scala语言基础、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、Spark SQL、Spark Streaming、Spark MLlib等。

相关文档

Spark Streaming技术内幕及源码剖析
Learning Real Time processing with Spark Streaming
Spark Streaming实时流式大数据处理实战
Apache Spark流处理
SPARK(计算引擎)
图解Spark:核心技术与案例实战
实时大数据分析基于Storm,Spark技术的实时应用
Spark海量数据处理:技术详解与平台实战
Spark编程基础(Scala版)
famurui.com
bfym.net
qimiaodingzhi.net
lyxs.net
qhnw.net
电脑版