在.NET中,IEnumerable<T>
序列是惰性的:这意味着当且仅当您需要时才执行底层逻辑。副作用是,如果您两次需要结果,则逻辑会执行两次。
例如,如果序列绑定到 SQL 数据库的结果,那么如果您首先计算元素数量,然后列出所有元素,则 SQL 查询将执行两次。
某些 LINQ 方法只是转换您的结果will得到,但没有实际得到结果。例如,var b = a.Where(a > 0);
不会运行底层逻辑,而是推迟到您真正需要结果为止。
其他 LINQ 方法有效地强制执行逻辑。Count()
例如,将强制加载所有元素以便对它们进行计数。ToArray()
or ToList()
也会这样做,将元素存储在内存中以供进一步使用。
您正在寻找的方法完全取决于上下文。
一般来说,您可能希望将序列存储在内存中,例如使用ToList()
——以便稍后对其进行多种操作,例如计算元素的数量,然后循环遍历所有元素。另一方面,在某些情况下您还需要其他东西:
-
为了将所有内容加载到内存中,底层逻辑的影响可能太大,迫使您寻找更智能的解决方案。想象一下,您正在进行数据库搜索,并且想要显示结果数量(例如 2 000 000)以及前 20 个条目。您真的需要将所有 2 000 000 个结果存储在内存中吗?可能不会。
这里的解决方案是做一个count
SQL 查询(数据库引擎将能够优化),然后是获取前 20 个结果的实际查询。
类似的例子是当您获取很少的元素时,但需要许多 CPU 周期才能获取单个元素。有时,当您只需要对元素进行计数时,可以使用快捷方式来简化复杂的工作。
或者可能会发生相反的情况:底层逻辑和数据量太小而无法真正关心。想象一下你正在与里面的人物打交道A-Za-z
范围。真的有必要做一个ToList()
?计数,然后分别循环遍历字符不是更容易吗?
有时,甚至不可能将所有元素存储在内存中。例如,如果您有无限序列(例如从不断写入的日志文件中刷新的行)怎么办?
但是,如果我正确理解 LINQ,它将在本地执行相同的操作(相同的循环和逻辑,无需任何特定的优化),无论我获取 Count() 还是执行 foreach。
这完全取决于您使用的 ORM。当您创建 LINQ 查询时,例如:
var count = this.SequenceFromDatabase
.Where(product => product.Price > 0)
.Count();
foreach (var product in this.SequenceFromDatabase.Take(10))
{
...
}
一些(如果不是大多数)ORM 实际上会将其转换为:
select count(1) from [Schema].[Table] where [Price] > 0
select top 10 [Name], [Price], [Availability] from [Schema].[Table]
鉴于从 LINQ 到 SQL 查询的实际转换取决于 ORM 和您编写的实际 LINQ 代码,因此必须密切关注正在执行的 SQL 查询。许多 ORM 都能够跟踪 SQL 查询,并且某些 SQL 引擎还允许您分析查询。