哪个方法性能更好:.Any() vs .Count() > 0?

在系统中。Linq命名空间，我们现在可以扩展我们的IEnumerable来拥有Any()和Count()扩展方法。

最近有人告诉我，如果我想检查一个集合中是否包含1个或多个项目，我应该使用. any()扩展方法而不是. count() > 0扩展方法，因为. count()扩展方法必须遍历所有项目。

其次，一些集合具有Count或Length属性(而不是扩展方法)。使用这些，而不是.Any()或.Count()会更好吗?

-是的-不?

当前回答

由于这是一个相当流行的话题，答案各不相同，我不得不重新审视这个问题。

测试env: EF 6.1.3, SQL Server, 300k记录

表模型:

class TestTable
{
    [Key]
    public int Id { get; set; }

    public string Name { get; set; }

    public string Surname { get; set; }
}

测试代码:

class Program
{
    static void Main()
    {
        using (var context = new TestContext())
        {
            context.Database.Log = Console.WriteLine;

            context.TestTables.Where(x => x.Surname.Contains("Surname")).Any(x => x.Id > 1000);
            context.TestTables.Where(x => x.Surname.Contains("Surname") && x.Name.Contains("Name")).Any(x => x.Id > 1000);
            context.TestTables.Where(x => x.Surname.Contains("Surname")).Count(x => x.Id > 1000);
            context.TestTables.Where(x => x.Surname.Contains("Surname") && x.Name.Contains("Name")).Count(x => x.Id > 1000);

            Console.ReadLine();
        }
    }
}

结果:

Any() ~ 3ms

Count()第一次查询~ 230ms，第二次查询~ 400ms

备注:

对于我的案例，EF没有像@Ben在他的帖子中提到的那样生成SQL。

2015-05-28 08:14:57

其他回答

你可以做一个简单的测试来弄清楚:

var query = //make any query here
var timeCount = new Stopwatch();
timeCount.Start();
if (query.Count > 0)
{
}
timeCount.Stop();
var testCount = timeCount.Elapsed;

var timeAny = new Stopwatch();
timeAny.Start();
if (query.Any())
{
}
timeAny.Stop();
var testAny = timeAny.Elapsed;

检查testCount和testAny的值。

2017-01-20 17:15:51

由于这是一个相当流行的话题，答案各不相同，我不得不重新审视这个问题。

测试env: EF 6.1.3, SQL Server, 300k记录

表模型:

class TestTable
{
    [Key]
    public int Id { get; set; }

    public string Name { get; set; }

    public string Surname { get; set; }
}

测试代码:

class Program
{
    static void Main()
    {
        using (var context = new TestContext())
        {
            context.Database.Log = Console.WriteLine;

            context.TestTables.Where(x => x.Surname.Contains("Surname")).Any(x => x.Id > 1000);
            context.TestTables.Where(x => x.Surname.Contains("Surname") && x.Name.Contains("Name")).Any(x => x.Id > 1000);
            context.TestTables.Where(x => x.Surname.Contains("Surname")).Count(x => x.Id > 1000);
            context.TestTables.Where(x => x.Surname.Contains("Surname") && x.Name.Contains("Name")).Count(x => x.Id > 1000);

            Console.ReadLine();
        }
    }
}

结果:

Any() ~ 3ms

Count()第一次查询~ 230ms，第二次查询~ 400ms

备注:

对于我的案例，EF没有像@Ben在他的帖子中提到的那样生成SQL。

2015-05-28 08:14:57

如果您正在使用实体框架，并且有一个包含许多记录的巨大表，Any()将会更快。我记得有一次，我想检查一个有数百万行的表是否为空。Count() > 0完成耗时20-30秒。Any()是即时的。

Any()可以提高性能，因为它可能不必迭代集合来获得事物的数量。只要击中其中一个就行。或者，对于LINQ-to-Entities，生成的SQL将是IF EXISTS(…)而不是SELECT COUNT…甚至选择* ....

2019-03-11 05:05:40

具体细节在。net Framework和。net Core中略有不同，但这也在一定程度上取决于你在做什么:如果你正在使用ICollection或ICollection<T>类型(例如List<T>)，则有一个. count属性易于访问，而其他类型可能需要枚举。

TL; diana:

如果属性存在，则使用. count > 0，否则使用. any()。

使用. count() > 0从来不是最好的选择，在某些情况下可能会非常慢。

这适用于。net Framework和。net Core。

现在我们可以开始讨论细节了。

列表和集合

让我们从一个非常常见的情况开始:使用List<T>(这也是ICollection<T>)。

.Count属性实现如下:

    private int _size;

    public int Count {
        get {
            Contract.Ensures(Contract.Result<int>() >= 0);
            return _size; 
        }
    }

这就是说，_size是由Add()，Remove()等维护的，因为它只是访问一个字段，这是一个非常便宜的操作——我们不需要迭代值。

ICollection和ICollection<T>都有. count，大多数实现它们的类型都可能以类似的方式这样做。

其他ienumerable

任何其他不是ICollection的IEnumerable类型都需要开始枚举来确定它们是否为空。影响性能的关键因素是我们最终是枚举单个项目(理想情况)还是整个集合(相对昂贵)。

如果收集实际上导致了I/O，比如从数据库或磁盘读取数据，这可能会对性能造成很大的影响。

.NET Framework .Any()

在.NET Framework(4.8)中，Any()实现是:

public static bool Any<TSource>(this IEnumerable<TSource> source) {
    if (source == null) throw Error.ArgumentNull("source");
    using (IEnumerator<TSource> e = source.GetEnumerator()) {
        if (e.MoveNext()) return true;
    }
    return false;
}

这意味着无论如何，它都将获得一个新的枚举器对象并尝试迭代一次。这比调用List<T>代价更大。属性，但至少它不是迭代整个列表。

.NET Framework .Count()

在.NET Framework(4.8)中，Count()实现(基本上)是:

public static int Count<TSource>(this IEnumerable<TSource> source)
{
    ICollection<TSource> collection = source as ICollection<TSource>;
    if (collection != null)
    { 
        return collection.Count;
    }
    int num = 0;
    using (IEnumerator<TSource> enumerator = source.GetEnumerator())
    {
        while (enumerator.MoveNext())
        {
            num = checked(num + 1);
        }
        return num;
    }
}

如果可用，ICollection。使用Count，但在其他情况下枚举集合。

.NET Core .Any()

. net Core中的LINQ Any()实现要聪明得多。你可以在这里看到完整的源代码，但与此讨论相关的部分:

    public static bool Any<TSource>(this IEnumerable<TSource> source)
    {
        //..snip..
        
        if (source is ICollection<TSource> collectionoft)
        {
            return collectionoft.Count != 0;
        }
        
        //..snip..

        using (IEnumerator<TSource> e = source.GetEnumerator())
        {
            return e.MoveNext();
        }
    }

因为List<T>是一个ICollection<T>，这将调用Count属性(尽管它调用了另一个方法，但没有额外的分配)。

.NET Core .Count()

. net Core实现(源代码)基本上与. net Framework(见上文)相同，因此它将使用ICollection。如果可用则计数，否则枚举集合。

总结

net框架

ICollection: 计数> 0是最好的 . count() > 0很好，但最终只调用ICollection。数 .Any()会比较慢，因为它枚举单个项使用非icollection (no .Count属性) .Any()是最好的，因为它只枚举单个项 .Count() > 0是坏的，因为它导致完全枚举

net核心

.Count > 0是最好的，如果可用(ICollection) . any()是很好的，将会做ICollection。计数> 0或枚举单个项目 .Count() > 0是坏的，因为它导致完全枚举

2020-08-24 22:41:39

这取决于数据集有多大，以及您的性能要求是什么?

如果不是很大，就用最易读的形式，这对我来说是任何，因为它比方程更短更易读。

2014-12-22 23:43:13

哪个方法性能更好:.Any() vs .Count() > 0?

推荐文章

最新文章

标签