我需要从hbase表中读取最新插入/更新的行,该表的行总数约为1500万行。我在这个论坛上看到很少有人建议在scan中使用timerange,但是在scan中使用timerange我们只能在某个时间点获得记录的“最新”状态。请告知我们如何检索上次插入/更新的记录。谢谢!
ibrsph3r1#
要检索最后插入的行,请在rowkey的前缀中添加reverse\ time\戳。所以最新的记录会在你扫描的时候排在第一位。在更新的情况下,删除旧的行并插入带有新的反向时间戳的新行。在更新的情况下,如果您确定删除和插入的成本,这将为您工作,因为它使您的获取非常有效。您将只扫描必要的记录。
1条答案
按热度按时间ibrsph3r1#
要检索最后插入的行,请在rowkey的前缀中添加reverse\ time\戳。所以最新的记录会在你扫描的时候排在第一位。在更新的情况下,删除旧的行并插入带有新的反向时间戳的新行。在更新的情况下,如果您确定删除和插入的成本,这将为您工作,因为它使您的获取非常有效。您将只扫描必要的记录。