如何在PRESTO查询中将regexp_place()与GROUP BY子句一起使用

628mspwn 于 2022-09-21 发布在 Presto

关注(0)|答案(1)|浏览(170)

我正在尝试基于自定义字段“ci_ku”检索记录。对于相同的“ci_ku”值，我们将有多个“l1m_visors”，我希望检索每个“ci_ku”的最小值“l1mvisors”。

示例数据：

预期产量：

Ku|ci_ku|l1M_visors
-|-|
1234-5678-HIJK|1234-HIJK|A

我尝试了下面的查询：

SELECT DISTINCT REGEXP_REPLACE(ku, CONCAT('-',CAST(v_nbr AS varchar)), '') AS ci_ku,
                ku,
                MIN(l1m_visits),
                last_refresh_date 
FROM db.schema.table 
GROUP BY ci_ku;

并面临以下错误：

第1行：194：无法解析列‘ci_ku’

postgresql

来源：https://stackoverflow.com/questions/73790199/how-to-use-regexp-replace-with-group-by-clause-in-presto-query

1条答案

按热度按时间

w7t8yxp51#

触发该错误是因为在计算GROUP BY子句时尚未生成字段“ci_ku”。此外，您的查询中还存在其他一些问题：

GROUP BY子句中并非所有未聚合的行都存在(应包含“ku”和“last_REFRESH_DATE”)
DISTINCT关键字将删除重复行，尽管SELECT语句后没有重复行。

与使用聚合不同，ROW_NUMBER窗口函数可能会更快地获得结果。它将为您的每个“ci_ku”值(PARTITION BY ci_ku)生成一个递增的数字，并按“l1M_ACCESSIONS”(ORDER BY ci_ku)排序，这样等于1的行号将表示每个“ci_ku”的最小“l1M_ACCESSIONS”。

WITH tab_with_ci_ku AS (
    SELECT REGEXP_REPLACE(ku, CONCAT('-',CAST(v_nbr AS varchar)), '') AS ci_ku,
           ku,
           l1m_visits,
           last_refresh_date
    FROM db.schema.table 
), ranked_visits AS (
    SELECT *, ROW_NUMBER() OVER(PARTITION BY ci_ku ORDER BY l1m_visits) AS rn
    FROM tab_with_ci_ku
)
SELECT ku,
       ci_ku,
       l1m_visits
FROM ranked_visits
WHERE rn = 1

如果您使用的是PostgreSQL，您还可以使用FETCH n ROWS WITH TIES子句来检索每个绑定行号的第一行(它将选择每个行号=1)：

WITH tab_with_ci_ku AS (
    SELECT REGEXP_REPLACE(ku, CONCAT('-',CAST(v_nbr AS varchar)), '') AS ci_ku,
           ku,
           l1m_visits,
           last_refresh_date
    FROM db.schema.table 
)
SELECT ku,
       ci_ku,
       l1m_visits
FROM ranked_visits
ORDER BY ROW_NUMBER() OVER(PARTITION BY ci_ku ORDER BY l1m_visits)
FETCH FIRST 1 ROWS WITH TIES;

赞(0）回复(0）举报 2022-09-21

我来回答

如何在PRESTO查询中将regexp_place()与GROUP BY子句一起使用

1条答案

相关问题

热门标签

最新问答