hadoop map reduce-访问丢失的数据

polhcujo  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(346)

假设我有一个从hadoop中提取大量数据的客户端脚本。hadoop中的哪些功能使我能够查看检索到的数据并请求(指出)缺失的数据部分,从而发出特定的请求来读取缺失的部分?此功能是datanode map还是reduce的一部分?
谢谢

kpbpu008

kpbpu0081#

没有直接的方法可以做到这一点。一旦您的脚本提取了数据并将其写入hdfs,它就只是另一段数据了。它与你的其他数据无关。你必须把它和你想比较的数据一起读,然后自己写一些符合你需要的比较逻辑来做比较。
首先,您可以查看多个输入。
p、 s:如果你能找到适合你的东西,请与我们分享。它会很有价值的。非常感谢。

相关问题