Hive中Sortby和orderby查询之间的区别

请任何人告诉我Hive SQLsort byorder by查询之间的区别

回答:

Hive支持SORT BY,可对每个reducer的数据进行排序。“ order by”和“ sort

by”之间的区别在于,前者保证输出中的总顺序,而后者仅保证精简器中行的排序。如果存在多个减速器,则“排序依据”可能会给出部分排序的最终结果。

注意:关于单个列的单独SORT BY与CLUSTER BY之间的区别可能会造成混淆。不同之处在于,如果存在多个reducer分区,则CLUSTER

BY按字段划分,而SORT BY则是随机划分,以便在reducer上均匀地分布数据(和负载)。

基本上,每个reducer中的数据将根据用户指定的顺序进行排序。以下示例显示

SELECT键,值FROM src SORT BY键ASC,值DESC

以上是 Hive中Sortby和orderby查询之间的区别 的全部内容, 来源链接: utcz.com/qa/423449.html

回到顶部