我对hbase和pig还不熟悉。我有一个hbase表,我想从pig脚本中获取max rowkey。有什么办法吗?
bxfogqkk1#
必须对元服务器进行互操作才能获取表中最后一个区域的结束行键。所有值都已排序,因此获取最后一个区域应该不难。这个info:regioninfo (此区域的序列化hregioninfo示例)包含您要查找的信息。如果pig不直接支持这一点,您可以编写一个用户定义的函数,将其放入类路径并从脚本中调用它。我不知道更好的方法。
1条答案
按热度按时间bxfogqkk1#
必须对元服务器进行互操作才能获取表中最后一个区域的结束行键。所有值都已排序,因此获取最后一个区域应该不难。
这个info:regioninfo (此区域的序列化hregioninfo示例)包含您要查找的信息。
如果pig不直接支持这一点,您可以编写一个用户定义的函数,将其放入类路径并从脚本中调用它。
我不知道更好的方法。