如何从aws雅典娜的不同s3存储桶中获取数据?

iswrvxsc  于 2021-07-29  发布在  Java
关注(0)|答案(2)|浏览(196)

我有两个桶。一个存储桶存储产品用户日志。另一个bucket存储用户属性(例如性别、年龄等)数据。
我想从这些bucket中获取用户日志和属性数据,并将这些数据合并到一个表中。我可以知道怎么做吗?

ipakzgxi

ipakzgxi1#

很简单。。。
使用 CREATE TABLE 要定义每个表,请指定 LOCATION 数据的
使用标准sql运行连接两个表的查询
可以同时查询两个表中的数据,也可以使用 CREATE TABLE AS .

cyej8jka

cyej8jka2#

只需使用下面的方法创建两个表

CREATE [EXTERNAL] TABLE [IF NOT EXISTS]
 [db_name.]table_name [(col_name data_type [COMMENT col_comment] [, ...] )]
 [COMMENT table_comment]
 [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
 [ROW FORMAT row_format]
 [STORED AS file_format] 
 [WITH SERDEPROPERTIES (...)] ]
 [LOCATION 's3://bucket_name/[folder]/']
 [TBLPROPERTIES ( ['has_encrypted_data'='true | false',] ['classification'='aws_glue_classification',] property_name=property_value [, ...] ) ]

然后连接两个表以创建所需的结果表
aws文档链接

相关问题