我使用的是MSSQL Server 2005。在我的db中,我有一个表“customerNames”,它有两列“Id”和“名称”和大约。1000年的结果。
我正在创建一个功能,每次都必须随机选择5个客户。谁能告诉我如何创建一个查询,将获得随机5行(Id,和名称)每次查询执行时?
我使用的是MSSQL Server 2005。在我的db中,我有一个表“customerNames”,它有两列“Id”和“名称”和大约。1000年的结果。
我正在创建一个功能,每次都必须随机选择5个客户。谁能告诉我如何创建一个查询,将获得随机5行(Id,和名称)每次查询执行时?
当前回答
如果你有一个有数百万行的表,并且关心性能,这可能是一个更好的答案:
SELECT * FROM Table1
WHERE (ABS(CAST(
(BINARY_CHECKSUM
(keycol1, NEWID())) as int))
% 100) < 10
https://msdn.microsoft.com/en-us/library/cc441928.aspx
其他回答
如果你不想使用NEWID()并且主键列是int,那么你可以像这样选择一个随机的主键:
with a as
(
select count(id) as row_count
from mytable
)
select *
from mytable , a
where id = round(rand() * row_count, 0)
这是一个老问题,但是尝试将一个新字段(NEWID()或ORDER BY rand())应用到一个有大量行的表将会非常昂贵。如果你有增量的,唯一的id(并且没有任何漏洞),计算要选择的id的X #会更有效,而不是应用一个GUID或类似于每一行,然后取X #的顶部。
DECLARE @minValue int;
DECLARE @maxValue int;
SELECT @minValue = min(id), @maxValue = max(id) from [TABLE];
DECLARE @randomId1 int, @randomId2 int, @randomId3 int, @randomId4 int, @randomId5 int
SET @randomId1 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId2 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId3 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId4 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId5 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
--select @maxValue as MaxValue, @minValue as MinValue
-- , @randomId1 as SelectedId1
-- , @randomId2 as SelectedId2
-- , @randomId3 as SelectedId3
-- , @randomId4 as SelectedId4
-- , @randomId5 as SelectedId5
select * from [TABLE] el
where el.id in (@randomId1, @randomId2, @randomId3, @randomId4, @randomId5)
如果你想选择更多的行,我会考虑用一个ID和一组rand()值填充一个#tempTable,然后使用每个rand()值缩放到最小-最大值。这样你就不必定义所有的@randomId1…n参数。下面是一个使用CTE填充初始表的示例。
DECLARE @NumItems int = 100;
DECLARE @minValue int;
DECLARE @maxValue int;
SELECT @minValue = min(id), @maxValue = max(id) from [TABLE];
DECLARE @range int = @maxValue+1 - @minValue;
with cte (n) as (
select 1 union all
select n+1 from cte
where n < @NumItems
)
select cast( @range * rand(cast(newid() as varbinary(100))) + @minValue as int) tp
into #Nt
from cte;
select * from #Nt ntt
inner join [TABLE] i on i.id = ntt.tp;
drop table #Nt;
我发现这对大数据最有效。
SELECT TOP 1 Column_Name FROM dbo.Table TABLESAMPLE(1 PERCENT);
TABLESAMPLE(n ROWS)或TABLESAMPLE(n PERCENT)是随机的,但需要添加TOP n以获得正确的样本量。
在大型表上使用newwid()非常慢。
如果你有一个有数百万行的表,并且关心性能,这可能是一个更好的答案:
SELECT * FROM Table1
WHERE (ABS(CAST(
(BINARY_CHECKSUM
(keycol1, NEWID())) as int))
% 100) < 10
https://msdn.microsoft.com/en-us/library/cc441928.aspx
这里有一个很好的Microsoft SQL Server 2005特定解决方案。 处理你正在处理一个大结果集的问题(不是我知道的问题)。
从大表中随机选择行 http://msdn.microsoft.com/en-us/library/cc441928.aspx