作者:张安站(作者) 出版:北京华章图文信息有限公司 图书简介 本书介绍了一些主流技术在商业项目中的应用,包括机器学习中的分类、聚类和线性回归,搜索引擎,推荐系统,用户行为跟踪,架构设计的基本理念及常用的消息和缓存机制。在这个过程中,我们有机会实践R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系统。如前所述,本书最大的特色就是,从商业需求出发演变到合理的技术方案和实现,因此根据不同的应用场景、不同的数据集合、不同的进阶难度,我们为读者提供了反复温习和加深印象的机会。 作者段落 "黄申 (作者)" 图片名 51cPIUEc5nL 结束 标题 Spark技术内幕:深入解析Spark内核架构设计与实现原理 (大数据技术丛书) 纸质书价格 ¥37.81 电子书价格 ¥19.98 专题 大数据技术丛书 文件大小 5810 KB 纸书页数 201 出版社 机械工业出版社; 第1版 (2015年9月1日) 服务:人工校对0错代录+录完后精校排版 此为收费服务:会收取文档代录之人工费 预估录入后页数:201(带目录书签跳转) 请支持正版图书,莫将本服务所得用于非法目的 ✅文档录入及格式制作人工服务,非骗流量 ❤️ 录入后格式:PDF、Word、PPT、ePub、TXT

Spark技术内幕:深入解析Spark内核架构设计与实现原理 (大数据技术丛书)(ePub+AZW3+PDF+高清)电子书下载 张安站(作者)

Spark是不断壮大的大数据分析解决方案家族中备受关注的新成员。它不仅为分布式数据集的处理提供了一个有效框架,而且以高效的方式处理分布式数据集。它支持实时处理、流处理和批处理,提供了统一的解决方案,因此极具竞争力。本书以源码为基础,深入分析Spark内核的设计理念和架构实现,系统讲解各个核心模块的实现,为性能调优、二次开发和系统运维提供理论支持,为更好地使用Spark Streaming、MLlib、Spark SQL和GraphX等奠定基础。