MySQL快速从600K行中随机选择10行

我如何才能最好地编写一个查询，从总共600k中随机选择10行?

当前回答

我想这是最好的办法了。

SELECT id, id * RAND( ) AS random_no, first_name, last_name
FROM user
ORDER BY random_no

2013-04-04 16:15:08

其他回答

我知道这不是你想要的，但我将给你的答案是我在一个小网站的生产中使用的。

根据您访问随机值的次数，不值得使用MySQL，因为您将无法缓存答案。我们在那里有一个按钮来访问一个随机页面，用户可以每分钟点击几次，如果他愿意的话。这将导致MySQL的大量使用，至少对我来说，MySQL是优化的最大问题。

我会采用另一种方法，你可以把答案存储在缓存中。调用MySQL:

SELECT min(id) as min, max(id) as max FROM your_table

使用min和max Id，您可以在服务器中计算一个随机数。在python中:

random.randint(min, max)

然后，用你的随机数，你可以在你的表中得到一个随机Id:

SELECT * 
FROM your_table 
WHERE id >= %s 
ORDER BY id ASC 
LIMIT 1

在这种方法中，对数据库执行两次调用，但是可以缓存它们，并且在很长一段时间内不访问数据库，从而提高性能。注意，如果表中有洞，这不是随机的。有超过一行很容易，因为你可以使用python创建Id，并为每行执行一个请求，但由于它们是缓存的，这是可以的。

如果你的表中有太多的洞，你可以尝试同样的方法，但是现在是记录的总数:

SELECT COUNT(*) as total FROM your_table

然后在python中你可以这样写:

random.randint(0, total)

为了获取一个随机结果，你可以使用如下所示的LIMIT:

SELECT * 
FROM your_table 
ORDER BY id ASC 
LIMIT %s, 1

注意它会在X个随机行之后得到1个值。即使您的表中有洞，它也将是完全随机的，但它将为您的数据库带来更多的开销。

2021-07-08 18:30:44

我认为这是一个简单但更快的方法，我在现场服务器上测试了它，与上面的几个答案相比，它更快。

 SELECT * FROM `table_name` WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `table_name` ) ORDER BY id LIMIT 30;

//对一个130行的表花费0.0014秒

SELECT * FROM `table_name` WHERE 1 ORDER BY RAND() LIMIT 30

//对130行的表花费0.0042秒

 SELECT name
FROM random AS r1 JOIN
   (SELECT CEIL(RAND() *
                 (SELECT MAX(id)
                    FROM random)) AS id)
    AS r2
WHERE r1.id >= r2.id
ORDER BY r1.id ASC
LIMIT 30

//对130行的表花费0.0040秒

2020-06-18 03:28:39

我想这是最好的办法了。

SELECT id, id * RAND( ) AS random_no, first_name, last_name
FROM user
ORDER BY random_no

2013-04-04 16:15:08

另一个简单的解决方案是对行进行排名，并随机获取其中之一，有了这个解决方案，你将不需要在表中有任何基于“Id”的列。

SELECT d.* FROM (
SELECT  t.*,  @rownum := @rownum + 1 AS rank
FROM mytable AS t,
    (SELECT @rownum := 0) AS r,
    (SELECT @cnt := (SELECT RAND() * (SELECT COUNT(*) FROM mytable))) AS n
) d WHERE rank >= @cnt LIMIT 10;

您可以根据需要更改限制值，以便访问尽可能多的行，但大多数情况下是连续的值。

然而，如果你不想要连续的随机值，那么你可以获取一个更大的样本并从中随机选择。就像……

SELECT * FROM (
SELECT d.* FROM (
    SELECT  c.*,  @rownum := @rownum + 1 AS rank
    FROM buildbrain.`commits` AS c,
        (SELECT @rownum := 0) AS r,
        (SELECT @cnt := (SELECT RAND() * (SELECT COUNT(*) FROM buildbrain.`commits`))) AS rnd
) d 
WHERE rank >= @cnt LIMIT 10000 
) t ORDER BY RAND() LIMIT 10;

2015-11-09 13:37:27

如果有一个自动生成的id，我发现一个很好的方法是使用模运算符'%'。例如，如果您需要70,000条随机记录中的10,000条，您可以简化为每7行中需要1行。这可以在这个查询中简化:

SELECT * FROM 
    table 
WHERE 
    id % 
    FLOOR(
        (SELECT count(1) FROM table) 
        / 10000
    ) = 0;

如果目标行除以total available的结果不是一个整数，那么你将得到比你要求的更多的行，所以你应该添加一个LIMIT子句来帮助你像这样修剪结果集:

SELECT * FROM 
    table 
WHERE 
    id % 
    FLOOR(
        (SELECT count(1) FROM table) 
        / 10000
    ) = 0
LIMIT 10000;

这确实需要一个完整的扫描，但它比ORDER BY RAND更快，在我看来，比本文中提到的其他选项更容易理解。另外，如果写入数据库的系统批量创建了一组行，你可能不会得到你所期望的随机结果。

2016-06-22 13:22:41

MySQL快速从600K行中随机选择10行

推荐文章

最新文章

标签