题目内容
(请给出正确答案)
[单选题]
Hive应用开发中,如下操作引起数据倾斜的概率最小的是哪个()。
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
答案
查看答案
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
第3题
A.所有HQL都会转化为MapReduce任务执行
B.DDL语句不提交任务到MapReduce,而是直接操作元数据
C.对于selectcount(*)fromtable操作,一定会启动reduce任务
D.对于selece*fromtable语句不会启MapReduce
第7题
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖