将SELECT DISTINCT ON查询从PostgreSQL转换为MySQL

tcomlyy6 于 5个月前发布在 Mysql

关注(0)|答案(5)|浏览(48)

我一直用PostgreSQL，现在迁移到MySQL。
在我的查询中，我使用的是PostgreSQL的SELECT DISTINCT ON (col1, col2, col3)，我想知道MySQL中是否有与此语句对应的语句。

mysql

来源：https://stackoverflow.com/questions/17673457/converting-select-distinct-on-queries-from-postgresql-to-mysql

5条答案

按热度按时间

yqyhoc1h1#

没有一个完全等效的转换PostgreSQL查询，使用SELECT DISTINCT ON到MySQL。

PostgreSQL SELECT DISTINCT ON

在Postgresql中，下面的查询将删除表达式(col1, col2, col3)匹配的所有行，并且它将只保留每组匹配行的“第一个col 4，col 5行”：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

字符串
如果你的table是这样的：

col1 | col2 | col3 | col4 | col5
--------------------------------
1    | 2    | 3    | 777  | 888
1    | 2    | 3    | 888  | 999
3    | 3    | 3    | 555  | 555

型
我们的查询将只保留一行（1，2，3）和一行（3，3，3）。结果行将是：

col4 | col5
-----------
777  | 888
555  | 555

型
请注意，每个集合的“第一行”是不可预测的，我们的第一行也可能是（888，999），除非我们指定一个ORDER BY：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

型
(the表达式上的DISTINCT必须匹配最左边的ORDER BY表达式，但ORDER BY可以包含其他表达式）。

MySQL对GROUP BY的扩展

MySQL扩展了GROUP BY的使用，这样我们就可以选择GROUP BY子句中没有命名的非聚合列。每当我们选择非聚合列时，服务器可以从该列的每个组中自由选择任何值，因此结果值将是不确定的。
所以这个PostgreSQL查询：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

型
可以被认为等同于这个MySQL查询：

SELECT col4, col5
FROM tablename
GROUP BY col1, col2, col3

型
Postgresql和MySQL都将返回每个（col 1，col 2，col 3）的“第一行”，并且在这两种情况下返回的行都是不可预测的，因为我们没有指定和排序by子句。
很多人会很想用ORDER BY转换这个PostgreSQL查询：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

型
这一个：

SELECT col4, col5
FROM (
  SELECT col1, col2, col3, col4, col5
  FROM tablename
  ORDER BY col1, col2, col3, col4
) s
GROUP BY col1, col2, col3

型
这里的想法是将ORDER BY应用于子查询，以便当MySQL按col 1，col 2，col 3分组时，它将保留col 4和col 5的第一个遇到的值。**这个想法很好，但它是错误的！**MySQL可以自由选择col 4和col 5的任何值，我们不知道哪些是第一个遇到的值，这取决于优化器。所以我将其更正为：

SELECT t1.col4, t1.col5
FROM tablename t1 INNER JOIN (SELECT col1, col2, col3, MIN(col4) as m_col4
                              FROM tablename
                              GROUP BY col1, col2, col3) s
     ON t1.col1=s.col1
        AND t1.col2=s.col2
        AND t1.col3=s.col3
        AND t1.col4=s.m_col4
GROUP BY
  t1.col1, t1.col2, t1.col3, t1.col4

型
但现在情况越来越复杂了

结论

一般来说，没有一种确切的方法可以将PostgreSQL查询转换为MySQL查询，但有很多变通方法，结果查询可能与原始查询一样简单，也可能变得非常复杂，但这取决于查询本身。

赞(0）回复(0）举报 5个月前

cnh2zyt32#

使用子查询确定顺序，使用外部查询对它们进行分组。
就像@a_horse_with_no_name指出的那样，这是可行的，因为MySQL允许部分group by，不像其他DBMS。
举例来说：

CREATE TABLE customer_order
    (`customer` varchar(5), `item` varchar(6), `date` datetime)
;

INSERT INTO customer_order
    (`customer`, `item`, `date`)
VALUES
    ('alice', 'widget', '2000-01-05 00:00:00'),
    ('bob', 'widget', '2000-01-02 00:00:00'),
    ('alice', 'widget', '2000-01-01 00:00:00'),
    ('alice', 'wodget', '2000-01-06 00:00:00')
;

字符串
查询每个客户的第一个订单：

select *
from
  (select customer, item, date
  from customer_order
  order by date) c
group by customer

型
测试结果：

| CUSTOMER |   ITEM |                           DATE |
|----------|--------|--------------------------------|
|    alice | widget | January, 01 2000 00:00:00+0000 |
|      bob | widget | January, 02 2000 00:00:00+0000 |

型
http://sqlfiddle.com/#!2/6cbbe/1

赞(0）回复(0）举报 5个月前

z3yyvxxp3#

如果在DISTINCT ON状态下，您希望从一对多关系中连接最后一个（或某些特定）记录，则可以执行以下操作：

SELECT * FROM customer c LEFT JOIN purchase p 
ON (SELECT purchaseID FROM purchase WHERE customerID = c.customerID ORDER BY Purchase_Date DESC LIMIT 1) = purchaseID

字符串

赞(0）回复(0）举报 5个月前

beq87vna4#

不能从多个列中选择非重复值。选择时，请像这样使用查询

select distinct col1, col2 from table

字符串

赞(0）回复(0）举报 5个月前

dz6r00yl5#

您应该迁移到PDO或MSYQLI，而不是MYSQL，因为它已经过时了。
关于你的问题，

SELECT DISTINCT col1, col2, col3

字符串
或

SELECT col1, col2, col3
    ........

    GROUP BY col1 --//--- or whatever column you want to be distinct

型

赞(0）回复(0）举报 5个月前

我来回答

将SELECT DISTINCT ON查询从PostgreSQL转换为MySQL

5条答案

相关问题

热门标签

最新问答