我有一个巨大的xml记录集,它们被分割成不同的文件。现在,如果一个记录从文件1开始,但没有在那里结束。相反,它在其他一些文件(比如file10)中继续。map reduce框架将如何识别记录的剩余部分,以便由同一Map器处理它?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!