hadoop面试题(自己整理版)

2024年3月11日 141次阅读来源: MapReduce

1、 hadoop 运行原理
2、 mapreduce 原理
3、 mapreduce 的优化
4、举一个简单的例子说下 mapreduce 是怎么运行的
5、 hadoop 中 combiner 的作用
6、简述 hadoop 的安装
7、请列出 hadoop 的进程名
8、简述 hadoop 的调度器
9、列出你开发 mapreduce 的语言
10、我们开发 job 时是否可以去掉 reduce 阶段
11、 datanode 在什么情况下不会备份
12、 combiner 出现在哪个过程
13、 hdfs 的体系结构
14、 3 个 datanode 中有一个 datanode 出现错误会怎么样
15、描述一下 hadoop 中，有哪些地方用了缓存机制，作用分别是
什么？
16、如何确定 hadoop 集群的健康状况
17、 shuffe 阶段，你怎么理解
18、 mapreduce 的 map 数量和 reduce 数量怎么确定，怎么配置
19、简单说一下 mapreduce 的编程模型
20、 hadoop 的 TextInputFormatter 作用是什么，如何自定义实现
21、 hadoop 和 spark 都是并行计算，他们有什么相同和区别
22、为什么要用 flume 导入 hdfs， hdfs 的架构是怎样的
23、简单说一下 hadoop 和 spark 的 shuffle 过程
24、 hadoop 高并发
25、 map-reduce 程序运行的时候会有什么比较常见的问题

    原文作者：MapReduce
    原文地址: https://www.cnblogs.com/bigdata-stone/p/9317640.html
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。