Hadoop面试中6个常见的问题及答案 准备好面试了吗?呀,需要Hadoop的知识!!?不要慌!这里有一些可能会问到的问题以及你应该给出的答案。 Q1.什么是Hadoop? Hadoop是一个开源软件框架,用于存储大量数…
分类:kafka
Kafka快速入门解析
参考官网:http://kafka.apache.org/quickstart一、下载Kafka官网下载地址 http://kafka.apache.org/downloads截至2019年7月8日 最新版本为 2.3.…
Redlock:Redis分布式锁最牛逼的实现
普通实现 说道Redis分布式锁大部分人都会想到:setnx+lua,或者知道set key value px milliseconds nx。后一种方式的核心实现命令如下: - 获取锁(unique_value可以是U…
从卡夫卡到村上春树
这几天的阅读真可谓是酣畅淋漓,自己一个人在图书馆,没有任何外界的打扰,没有学业上的任何压力与焦虑。我昨天读了乔治·奥威尔的《1984》,今天又读了卡夫卡《判决》《变形记》等一系列短篇,又一次真正体会到文学的伟大与魅力之无…
在你的 Java 程序里调用 Kafka 发起数据流
Kafka 与 Java 的集成最容易实现了。 按照文档上面的例子,稍微改一改就能用。 kafka 是 LinkedIn 的开源产品 源代码托管在 https://github.com/apache/kafka 上面 因…
Spark踩坑记
Spark踩坑记 https://zhuanlan.zhihu.com/p/60657101 【1号坑】spark-submit提交 jar 失败 提示:spark-submit /bin/spark-class: No…
Haproxy通过rsyslog吐日志给kafka
为了给Haproxy做异步的监控统计,打算将Haproxy的log输出到kafka,由后面的监控应用(Spark)处理后再进行存储展现(Influxdb+Grafana),而rsyslog可以支持不同input、outp…
kafka client源码阅读:KafkaConsumer
入口KafkaConsumer.poll: private ConsumerRecords<K, V> poll(final Timer timer, final boolean includeMetadat…
Kafka 2017技术峰会摘要(pipeline分类)
下载全部视频和PPT,请关注公众号(bigdata_summit),并点击“视频下载”菜单 Billions of Messages a Day – Yelp’s Real-time Data Pipeline by J…
虚拟机上安装集群kafka
文章目录 安装步骤 1.前置步骤 2.修改host配置 3.配置环境变量 4.关闭102 103机子防火墙 5.配置时钟服务器 6.配置zookeeper 7.配置服务id映射 8.配置kafka单节点为多节点 9.ka…
Kafka 读书-2:《The Kafka definitive guide》
构建数据管道 Kafka最主要的作用:解耦,异步,当做一个非常的大,可靠的buffer。因此构建数据管道时需要考虑的有: 时间性 可靠性 高吞吐量,尤其是高峰低谷交错 数据格式 安全 耦合:没有一个通用的数据管道,只是单…
Kafka Consumer消费能力较低时的解决方案
背景 随着业务的发展,项目组有大量的任务需要处理。 这些任务需要主要分为两种类型: 通过接口调用, 后台执行任务 通过调度系统定时执行 接口调用就需要执行任务不能阻塞, 不然系统的处理能力就会下降。任务调度系统需要在在一…