书籍: PySpark SQL Recipes_ With HiveQL, Dataframe and Graphframes - 2019.pdf

简介

《书籍: PySpark SQL Recipes_ With HiveQL, Dataframe and Graphframes - 2019.pdf》 图片.png

PySpark SQL Recipes:使用HiveQL,Dataframe和Graphframes Pdf

使用问题解决方案方法,使用PySpark SQL,图形框架和图形数据处理进行数据分析。本书提供了与数据框架,数据操作摘要和探索性分析相关的问题的解决方案。您将使用图形框架提高图形数据分析的技能,并了解如何优化PySpark SQL代码。

PySpark SQL Recipes首先介绍了使用PySpark SQL创建来自不同类型数据源,数据聚合和汇总以及探索性数据分析的数据帧的方法。您还将了解如何使用图框来解决图分析中的问题。

完成本书后,您将拥有所有PySpark SQL任务的现成代码,包括使用来自不同文件格式以及SQL或NoSQL数据库的数据创建数据帧。

参考资料

你会学到什么

  • 了解PySpark SQL及其高级功能
  • 在PySpark SQL中使用SQL和HiveQL
  • 使用结构化流媒体
  • 优化PySpark SQL
  • 掌握图形框架和图形处理

本书对象

数据科学家,Python程序员和SQL程序员。

    原文作者:python人工智能命理
    原文地址: https://www.jianshu.com/p/8e3132c4a92d
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞