比较文件中的差异

wmomyfyw  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(336)

我有一个应用程序,找出两个文件夹之间的差异。它提供在新文件夹中修改的所有文件的报告。创建的报告是一个html报告,它显示了差异。到目前为止,我已经用普通java实现了它,并在部署在tomcat上的spring框架中创建了一个web应用程序,效果很好。
现在用户基数如此之大,以至于人们开始提供1GB的文件夹。我的申请书就在这上面消失了。目前在我的核心逻辑中,我将文件作为一个字符串数组,然后将每个数组元素与第二个数组中相应的数组元素进行比较,并有一个算法来处理添加和删除操作。
我想让我的应用程序支持gb的数据,并找到差异。我不知道这是否很容易在java中实现。我对hadoop只有一个基本的概念。使用hadoop真的有可能吗。是否有一个指针,我可以从它开始构建应用程序?
---------添加有关应用程序的更多信息

a6b3iqyw

a6b3iqyw1#


我们的产品应用程序确实包含很多元数据xml文件。某些错误可能会损坏xml文件。在这些情况下,临时修复是提供清理(纠正损坏的xml)。为了跟踪这个清理活动,我们有一个工具,它要求执行清理的开发人员提供旧的元数据文件夹和已清理的元数据文件夹。我们用它来创建评审报告,然后交给管理层进行评审和批准
提前谢谢你的帮助。
b1层

相关问题