精通Spark数据科学

用Spark构建商业级数据科学解决方案Key Features通过一系列典型的案例讲解,由浅入深使用Spark构建商业级数据科学解决方案Book DescriptionApache Spark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书,旨在教会读者利用Spark构建实用的数据科学解决方案。 本书内容包括14章,由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构建推荐系统、新闻词典和实时标记系统、故事除重和变迁、情感分析中的异常检测、趋势演算、数据保护和可扩展算法。 本...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Antoine Amend, David George, Matthew Hallett, Andrew Morgan, Posts & Telecom Press
Format: Buch
Sprache:eng
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:用Spark构建商业级数据科学解决方案Key Features通过一系列典型的案例讲解,由浅入深使用Spark构建商业级数据科学解决方案Book DescriptionApache Spark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书,旨在教会读者利用Spark构建实用的数据科学解决方案。 本书内容包括14章,由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构建推荐系统、新闻词典和实时标记系统、故事除重和变迁、情感分析中的异常检测、趋势演算、数据保护和可扩展算法。 本书适合数据科学家以及对数据科学、机器学习感兴趣的读者阅读,需要读者具备数据科学相关的基础知识,并通过阅读本书进一步提升Spark运用能力,从而创建出高效且实用的数据科学解决方案。What you will learn数据科学生态系统数据获取输入格式与模式探索性数据分析利用Spark进行地理分析采集基于链接的外部数据构建社区、构建推荐系统新闻词典和实时标记系统故事除重和变迁情感分析中的异常检测趋势演算数据保护和可扩展算法Who this book is for我们假定阅读这本书的数据科学家已经对数据科学、常用的机器学习方法和流行的数据科学工具有一定的了解,已在工作过程中进行了概念验证研究并构建了原型。本书向读者介绍建立数据科学解决方案的先进技术和方法,并展示如何构建商业级数据产品。