归档传入的小型hdfs文件

gpfsuwkq  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(353)

我每天都有小文件进入hdfs。我计划使用hadoop归档(har),但是如何归档这些每天都会进入hdfs的小文件呢。例句:我今天可能会得到5个文件,我需要存档,明天如果我再得到5个文件,我需要把这个附加到前几天的存档中。

eagi6jfj

eagi6jfj1#

不能将文件添加到现有的har文件中。您需要取消归档并重新归档或共享文件几天,然后继续创建归档文件。

相关问题