hive order by弄乱了数据

bqucvtff  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(413)

在具有hadoop 1.03的hive 0.8中,请考虑下表:

CREATE TABLE table (
  key int,
  date timestamp,
  name string,
  surname string,
  height int,
  weight int,
  age int) 
CLUSTERED BY(key) INTO 128 BUCKETS
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

然后我试着:

select *
from table
where key=xxx
order by date;

结果已排序,但列名后的所有内容都是错误的。事实上,所有的行在各自的字段中都有完全相同的值,并且缺少姓氏列。我还有一个关于名字和姓氏的位图索引和一个关于键的索引。
我的查询是否有问题,或者我是否应该查找orderby的bug(我找不到任何具体的东西)。

nkoocmlb

nkoocmlb1#

似乎将数据加载到配置单元时出错。确保csv文件中没有任何可能干扰插入的特殊字符。
您已经按key属性进行了聚类。这个密钥来自csv?或者其他来源?你确定这是独一无二的吗?

相关问题