从hbase读取最新插入/更新的100条记录

xam8gpfp  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(460)

我需要从hbase表中读取最新插入/更新的行,该表的行总数约为1500万行。
我在这个论坛上看到很少有人建议在scan中使用timerange,但是在scan中使用timerange我们只能在某个时间点获得记录的“最新”状态。
请告知我们如何检索上次插入/更新的记录。谢谢!

ibrsph3r

ibrsph3r1#

要检索最后插入的行,请在rowkey的前缀中添加reverse\ time\戳。所以最新的记录会在你扫描的时候排在第一位。在更新的情况下,删除旧的行并插入带有新的反向时间戳的新行。在更新的情况下,如果您确定删除和插入的成本,这将为您工作,因为它使您的获取非常有效。您将只扫描必要的记录。

相关问题