hadoop—MapReduce如何确保跨不同文件拆分的单个xml记录的所有数据都到同一个Map器

wwodge7n  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(199)

我有一个巨大的xml记录集,它们被分割成不同的文件。现在,如果一个记录从文件1开始,但没有在那里结束。相反,它在其他一些文件(比如file10)中继续。map reduce框架将如何识别记录的剩余部分,以便由同一Map器处理它?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题