使用hadoop集群的处理能力，而不是gnu/linux机器

cetgtptt 于 2021-06-04 发布在 Hadoop

关注(0)|答案(0)|浏览(210)

我正在对hadoop集群上的两个文件进行区分。diff<（hcat file1）<（hcat file2）挑战在于文件大小>10gb。如果我们想同时区分100个这样的文件，那么gnu/linux机器的处理能力就会受到影响。有没有一种方法可以利用hadoop集群的处理能力来同时区分如此大的文件？

hadoop linux Diff

来源：https://stackoverflow.com/questions/22066827/use-the-processing-power-of-hadoop-cluster-rather-than-the-gnu-linux-machine

暂无答案！

目前还没有任何答案，快来回答吧！

相关问题

微信公众号

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

Python pillow/PIL无法识别对象“imagedraw”的属性“textsize”
回答(3) 发布于 5个月前
python-3.x ImportError：无法从“typing_extensions”导入名称“deprecated”
回答(2) 发布于 5个月前
python-3.x 我正尝试使用密码学对字典进行加密
回答(1) 发布于 5个月前
在Python的IDLE中导入audiolazy的问题
回答(1) 发布于 5个月前
如何将Python程序中的数据添加到Markdown？
回答(2) 发布于 5个月前