hadoop组件---spark理论----spark on k8s模式的三种方式全面了解

2024年1月28日 171次阅读来源: 张小凡vip

我们在之前的文章中已经了解了 spark支持的模式，其中一种就是使用k8s进行管理。

spark on k8s的优势–为什么要把Spark部署在k8s上

大数据和云计算一直分属两个不同的领域。大数据主要关注怎么将数据集中起来，挖掘数据的价值；云计算主要关注怎么更高效地使用资源，提升资源的利用效率。当大数据发展到一定阶段的时候，它就会和云计算不期而遇。

两者的结合有以下优势:

一般来说每个公司大数据的平台和云计算平台都是不可缺少的。

也就意味着我们有两套体系的集群
一套是Hadoop+spark 或者是商用的EMR。
一套是k8s，用于部署微服务和常规分析流程等应用。

两套集群意味着比较复杂的管理成本，两套集群都分别要做好安全和用户识别，以及日志监控报警，后续的成本跟踪和优化等措施。

假如我们能把spark运行在k8s中，这样我们的技术栈体系就会统一成一套集群体系，我们所有的安全，用户识别以及日志监控报警以及成本跟踪都可以使用k8s体系的。

    原文作者：张小凡vip
    原文地址: https://blog.csdn.net/q383965374/article/details/104043792
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。