hadoop面试题(自己整理版)

1hadoop 运行原理
2mapreduce 原理
3mapreduce 的优化
4、举一个简单的例子说下 mapreduce 是怎么运行的
5hadoop combiner 的作用
6、简述 hadoop 的安装
7、请列出 hadoop 的进程名
8、简述 hadoop 的调度器
9、列出你开发 mapreduce 的语言
10、我们开发 job 时是否可以去掉 reduce 阶段
11datanode 在什么情况下不会备份
12combiner 出现在哪个过程
13hdfs 的体系结构
143 datanode 中有一个 datanode 出现错误会怎么样
15、描述一下 hadoop 中,有哪些地方用了缓存机制,作用分别是
什么?
16、如何确定 hadoop 集群的健康状况
17shuffe 阶段,你怎么理解
18mapreduce map 数量和 reduce 数量怎么确定,怎么配置
19、简单说一下 mapreduce 的编程模型
20hadoop TextInputFormatter 作用是什么,如何自定义实现
21hadoop spark 都是并行计算,他们有什么相同和区别
22、为什么要用 flume 导入 hdfshdfs 的架构是怎样的
23、简单说一下 hadoop spark shuffle 过程
24hadoop 高并发
25map-reduce 程序运行的时候会有什么比较常见的问题

    原文作者:MapReduce
    原文地址: https://www.cnblogs.com/bigdata-stone/p/9317640.html
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞