如何为单个配置单元表和增量数据创建事实表和维度表

bkkx9g8r  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(222)

我是在配置单元中创建数据仓库(星型架构)的新手。我的要求是,我能够使用sqoop job获得一个配置单元表和增量数据。对于这个配置单元表,我必须创建事实表和维度表以及不断更新的数据。有没有可能在Hive中,如果有如何创建。如果没有什么是另一种方法。如果有人有任何想法,请与我分享。

piah890a

piah890a1#

您可以使用某些步骤来自动化您的需求
创建一个shell脚本,该脚本将包含用于创建事实维度表的配置单元查询
如。 your_shell_script.sh 将包含代码


# !/bin/sh

hive -e "use hivedb; CREATE TABLE FACTS as select your columns from Source_table;"

hive -e "use hivedb; CREATE TABLE DIMENSIONS as Select your coloumns from Source_table;"

注意:您可以使用任何您想要使用的createtable方法,这取决于您想要如何创建您的表,您还可以添加分区。
启动linux操作系统的crontab deamon。
在linux中创建一个crontab条目,它将在主源表sqoop上传完成后的特定时间执行shell脚本。
如。 crontab -e ```
0 11 * * * /path/to/your/script/your_shell_script.sh

注意这个crontab条目将在上午11点运行shell脚本(在您的sqoop加载之后)
希望这有帮助。

相关问题