最近得到松勤讲师部的情报,想了解大数据测试的学员比较多,那么在真正面试的时候,大数据测试又会问到哪些问题呢?

带着这个问题,小编总结了一些今年关于大数据测试的热门面试题,是一些经常出现、有价值的试题,包含hadoop、hive、hbase、storm、spark等。答案仅供参考,如有错误,请指出。试题不定时更新。

1、datanode在什么情况下不会备份

2、请列出你所知道的hadoop调度器,并简要说明其工作方法?

3、Hadoop安装在什么目录下?

4、当你输入hadoopfsck 造成“connection refused java exception’”时,系统究竟发生了什么?

5、spark调优

6、RAM的溢出因子是?

7、hive sql知识点

8、为什么hive的分区

9、当前日志采样格式为

10、Namenode、Job tracker和task tracker的端口号是?

11、请用java实现非递归二分查询

12、是客户端还是Namenode决定输入的分片?

13、mapred.job.tracker命令的作用?

14、全分布模式又有什么注意点?

15、hive 跟hbase的区别

16、请列出正常工作的hadoop集群中hadoop都需要启动哪些进程,他们的作用分别是什么?

17、KafkaUtils.createDstream 和KafkaUtils.createDirectstream 区别

18、Kafka与传统消息队列的区别

19、Master文件是否提供了多个入口?

20、Spark的数据本地性有哪几种?

需要答案可后台留言哦!