在系统中。Linq命名空间,我们现在可以扩展我们的IEnumerable来拥有Any()和Count()扩展方法。

最近有人告诉我,如果我想检查一个集合中是否包含1个或多个项目,我应该使用. any()扩展方法而不是. count() > 0扩展方法,因为. count()扩展方法必须遍历所有项目。

其次,一些集合具有Count或Length属性(而不是扩展方法)。使用这些,而不是.Any()或.Count()会更好吗?

-是的-不?


当前回答

使用Count()来测试是否为空,但使用Any()可以使意图更清晰,代码更可读。然而,有一些情况需要特别注意:

如果集合是一个EntityFramework或其他ORM查询,调用Count()将导致执行一个潜在的大规模SQL查询,并可能给应用程序数据库带来很大的开销。调用Any()也将连接到数据库,但将生成更高效的SQL。

如果集合是包含创建对象的Select()语句的LINQ查询的一部分,则可能会不必要地分配大量内存。调用Any()将更有效,因为它将执行更少的枚举迭代。

使用Any()的示例:

private static bool IsEmpty(IEnumerable<string> strings)
{
  return !strings.Any();
}

其他回答

这取决于数据集有多大,以及您的性能要求是什么?

如果不是很大,就用最易读的形式, 这对我来说是任何,因为它比方程更短更易读。

编辑:在EF 6.1.1版本中修复。这个答案是不实际的

对于SQL Server和EF4-6, Count()的执行速度比Any()快两倍。

当你运行Table.Any()时,它会生成类似这样的东西(警告:不要伤害大脑试图理解它)

SELECT 
CASE WHEN ( EXISTS (SELECT 
    1 AS [C1]
    FROM [Table] AS [Extent1]
)) THEN cast(1 as bit) WHEN ( NOT EXISTS (SELECT 
    1 AS [C1]
    FROM [Table] AS [Extent2]
)) THEN cast(0 as bit) END AS [C1]
FROM  ( SELECT 1 AS X ) AS [SingleRowTable1]

这需要对符合条件的行进行两次扫描。

我不喜欢写Count() > 0,因为它隐藏了我的意图。我更喜欢使用自定义谓词:

public static class QueryExtensions
{
    public static bool Exists<TSource>(this IQueryable<TSource> source, Expression<Func<TSource, bool>> predicate)
    {
        return source.Count(predicate) > 0;
    }
}

我已经使用IList创建了一个示例应用程序,其中包含100个元素到100万个项目,以查看Count vs Any哪个是最好的。

Code

class Program
{
    static void Main()
    {

        //Creating List of customers
        IList<Customer> customers = new List<Customer>();
        for (int i = 0; i <= 100; i++)
        {
            Customer customer = new Customer
            {
                CustomerId = i,
                CustomerName = string.Format("Customer{0}", i)
            };
            customers.Add(customer);
        }

        //Measuring time with count
        Stopwatch stopWatch = new Stopwatch();
        stopWatch.Start();
        if (customers.Count > 0)
        {
            Console.WriteLine("Customer list is not empty with count");
        }
        stopWatch.Stop();
        Console.WriteLine("Time consumed with count: {0}", stopWatch.Elapsed);

        //Measuring time with any
        stopWatch.Restart();
        if (customers.Any())
        {
            Console.WriteLine("Customer list is not empty with any");
        }
        stopWatch.Stop();
        Console.WriteLine("Time consumed with count: {0}", stopWatch.Elapsed);
        Console.ReadLine();

    }
}

public class Customer
{
    public int CustomerId { get; set; }
    public string CustomerName { get; set; }
}

结果:

任何都比数好。

具体细节在。net Framework和。net Core中略有不同,但这也在一定程度上取决于你在做什么:如果你正在使用ICollection或ICollection<T>类型(例如List<T>),则有一个. count属性易于访问,而其他类型可能需要枚举。

TL; diana:

如果属性存在,则使用. count > 0,否则使用. any()。

使用. count() > 0从来不是最好的选择,在某些情况下可能会非常慢。

这适用于。net Framework和。net Core。


现在我们可以开始讨论细节了。

列表和集合

让我们从一个非常常见的情况开始:使用List<T>(这也是ICollection<T>)。

.Count属性实现如下:

    private int _size;

    public int Count {
        get {
            Contract.Ensures(Contract.Result<int>() >= 0);
            return _size; 
        }
    }

这就是说,_size是由Add(),Remove()等维护的,因为它只是访问一个字段,这是一个非常便宜的操作——我们不需要迭代值。

ICollection和ICollection<T>都有. count,大多数实现它们的类型都可能以类似的方式这样做。

其他ienumerable

任何其他不是ICollection的IEnumerable类型都需要开始枚举来确定它们是否为空。影响性能的关键因素是我们最终是枚举单个项目(理想情况)还是整个集合(相对昂贵)。

如果收集实际上导致了I/O,比如从数据库或磁盘读取数据,这可能会对性能造成很大的影响。


.NET Framework .Any()

在.NET Framework(4.8)中,Any()实现是:

public static bool Any<TSource>(this IEnumerable<TSource> source) {
    if (source == null) throw Error.ArgumentNull("source");
    using (IEnumerator<TSource> e = source.GetEnumerator()) {
        if (e.MoveNext()) return true;
    }
    return false;
}

这意味着无论如何,它都将获得一个新的枚举器对象并尝试迭代一次。这比调用List<T>代价更大。属性,但至少它不是迭代整个列表。

.NET Framework .Count()

在.NET Framework(4.8)中,Count()实现(基本上)是:

public static int Count<TSource>(this IEnumerable<TSource> source)
{
    ICollection<TSource> collection = source as ICollection<TSource>;
    if (collection != null)
    { 
        return collection.Count;
    }
    int num = 0;
    using (IEnumerator<TSource> enumerator = source.GetEnumerator())
    {
        while (enumerator.MoveNext())
        {
            num = checked(num + 1);
        }
        return num;
    }
}

如果可用,ICollection。使用Count,但在其他情况下枚举集合。


.NET Core .Any()

. net Core中的LINQ Any()实现要聪明得多。你可以在这里看到完整的源代码,但与此讨论相关的部分:

    public static bool Any<TSource>(this IEnumerable<TSource> source)
    {
        //..snip..
        
        if (source is ICollection<TSource> collectionoft)
        {
            return collectionoft.Count != 0;
        }
        
        //..snip..

        using (IEnumerator<TSource> e = source.GetEnumerator())
        {
            return e.MoveNext();
        }
    }

因为List<T>是一个ICollection<T>,这将调用Count属性(尽管它调用了另一个方法,但没有额外的分配)。

.NET Core .Count()

. net Core实现(源代码)基本上与. net Framework(见上文)相同,因此它将使用ICollection。如果可用则计数,否则枚举集合。


总结

net框架

ICollection: 计数> 0是最好的 . count() > 0很好,但最终只调用ICollection。数 .Any()会比较慢,因为它枚举单个项 使用非icollection (no .Count属性) .Any()是最好的,因为它只枚举单个项 .Count() > 0是坏的,因为它导致完全枚举

net核心

.Count > 0是最好的,如果可用(ICollection) . any()是很好的,将会做ICollection。计数> 0或枚举单个项目 .Count() > 0是坏的,因为它导致完全枚举

如果您从具有. length或. count的东西开始(例如ICollection<T>, IList<T>, List<T>,等等),那么这将是最快的选项,因为它不需要通过Any()所要求的GetEnumerator()/MoveNext()/Dispose()序列来检查非空IEnumerable<T>序列。

对于IEnumerable<T>,则Any()通常会更快,因为它只需要查看一次迭代。但是,请注意Count()的LINQ-to-Objects实现确实检查ICollection<T>(使用.Count作为优化)-因此,如果您的底层数据源直接是一个列表/集合,则不会有很大的区别。不要问我为什么不使用非泛型的ICollection…

当然,如果你已经使用LINQ来过滤它(Where等),你将有一个基于迭代器块的序列,所以这个ICollection<T>优化是无用的。

通常,对于IEnumerable<T>:坚持使用Any();-p