pig分布式缓存

huwehgph  于 2021-06-25  发布在  Pig
关注(0)|答案(1)|浏览(299)

两者有什么区别 getShipFiles & getCacheFilesEvalFunc 上课?
假设此方法中指定的任何文件都可用于 exec 来自分布式缓存的方法

h7appiyu

h7appiyu1#

getcachefiles()允许udf指定要放置在分布式缓存中的hdfs文件的列表。
getshipfiles()允许udf指定要放置在分布式缓存中的本地文件列表。
所以getshipfiles从本地文件中获取文件,然后缓存从hdfs中获取它们。

相关问题