streaming

为什么要用消息队列?比如有很多数据源在采集产生数据,如果直接把数据扔给spark streaming,可能各个产生的频率,即压力大小不同,造成spark产生问题。消息队列高吞吐,如kafka,可解决这个问题。

    原文作者:博瑜
    原文地址: https://www.jianshu.com/p/08a55dc756ca
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞