我是在配置单元中创建数据仓库(星型架构)的新手。我的要求是,我能够使用sqoop job获得一个配置单元表和增量数据。对于这个配置单元表,我必须创建事实表和维度表以及不断更新的数据。有没有可能在Hive中,如果有如何创建。如果没有什么是另一种方法。如果有人有任何想法,请与我分享。
piah890a1#
您可以使用某些步骤来自动化您的需求创建一个shell脚本,该脚本将包含用于创建事实维度表的配置单元查询如。 your_shell_script.sh 将包含代码
your_shell_script.sh
# !/bin/sh hive -e "use hivedb; CREATE TABLE FACTS as select your columns from Source_table;" hive -e "use hivedb; CREATE TABLE DIMENSIONS as Select your coloumns from Source_table;"
注意:您可以使用任何您想要使用的createtable方法,这取决于您想要如何创建您的表,您还可以添加分区。启动linux操作系统的crontab deamon。在linux中创建一个crontab条目,它将在主源表sqoop上传完成后的特定时间执行shell脚本。如。 crontab -e ```0 11 * * * /path/to/your/script/your_shell_script.sh
crontab -e
注意这个crontab条目将在上午11点运行shell脚本(在您的sqoop加载之后) 希望这有帮助。
1条答案
按热度按时间piah890a1#
您可以使用某些步骤来自动化您的需求
创建一个shell脚本,该脚本将包含用于创建事实维度表的配置单元查询
如。
your_shell_script.sh
将包含代码注意:您可以使用任何您想要使用的createtable方法,这取决于您想要如何创建您的表,您还可以添加分区。
启动linux操作系统的crontab deamon。
在linux中创建一个crontab条目,它将在主源表sqoop上传完成后的特定时间执行shell脚本。
如。
crontab -e
```0 11 * * * /path/to/your/script/your_shell_script.sh