有人能解释一下什么是GroupJoin()吗?

它与常规Join()有何不同?

它常用吗?

它只是用于方法语法吗?查询语法怎么样?(一个c#代码示例会很好)


根据eduLINQ:

了解GroupJoin所做的事情的最好方法是考虑 加入。在这里,总体的想法是我们透过“外部” 输入序列,从“内”序列中找到所有匹配项 (基于每个序列上的关键投影),然后产生对 匹配的元素。GroupJoin与此类似,不同之处在于 生成元素对,它为每个“外部”生成单个结果 项和匹配“内部”项的序列。

唯一的区别是return语句:

加入:

var lookup = inner.ToLookup(innerKeySelector, comparer); 
foreach (var outerElement in outer) 
{ 
    var key = outerKeySelector(outerElement); 
    foreach (var innerElement in lookup[key]) 
    { 
        yield return resultSelector(outerElement, innerElement); 
    } 
} 

GroupJoin:

var lookup = inner.ToLookup(innerKeySelector, comparer); 
foreach (var outerElement in outer) 
{ 
    var key = outerKeySelector(outerElement); 
    yield return resultSelector(outerElement, lookup[key]); 
} 

点击此处阅读更多信息:

重新实现对象的LINQ:第19部分-连接 重新实现对象的LINQ:第22部分- GroupJoin


行为

假设你有两个列表:

Id  Value
1   A
2   B
3   C

Id  ChildValue
1   a1
1   a2
1   a3
2   b1
2   b2

当你加入Id字段上的两个列表时,结果将是:

Value ChildValue
A     a1
A     a2
A     a3
B     b1
B     b2

当你GroupJoin Id字段上的两个列表时,结果将是:

Value  ChildValues
A      [a1, a2, a3]
B      [b1, b2]
C      []

因此,Join生成父值和子值的平面(表格)结果。 GroupJoin在第一个列表中生成一个条目列表,每个条目在第二个列表中生成一组已连接的条目。

这就是为什么Join在SQL中相当于INNER Join: C没有条目,而GroupJoin相当于OUTER Join: C在结果集中,但是有一个空的相关条目列表(在SQL结果集中会有一行C - null)。

语法

因此,设两个列表分别为IEnumerable<Parent>和IEnumerable<Child>。(如果Linq to Entities: IQueryable<T>)。

联接语法将是

from p in Parent
join c in Child on p.Id equals c.Id
select new { p.Value, c.ChildValue }

返回IEnumerable< x>,其中X是一个匿名类型,具有Value和ChildValue两个属性。该查询语法在底层使用Join方法。

GroupJoin语法为

from p in Parent
join c in Child on p.Id equals c.Id into g
select new { Parent = p, Children = g }

返回一个IEnumerable<Y>,其中Y是一个匿名类型,由一个Parent类型的属性和一个IEnumerable<Child类型的属性组成。该查询语法在底层使用GroupJoin方法。

我们可以在后面的查询中选择g,它会选择一个IEnumerable<IEnumerable<Child>>,也就是一个列表的列表。在许多情况下,包含父类的select更有用。

一些用例

1. 产生一个平坦的外部连接。

如前所述,声明…

from p in Parent
join c in Child on p.Id equals c.Id into g
select new { Parent = p, Children = g }

... 生成带有子组的父组列表。这可以通过两个小的添加变成一个扁平的父子对列表:

from p in parents
join c in children on p.Id equals c.Id into g // <= into
from c in g.DefaultIfEmpty()               // <= flattens the groups
select new { Parent = p.Value, Child = c?.ChildValue }

结果与

Value Child
A     a1
A     a2
A     a3
B     b1
B     b2
C     (null)

注意,范围变量c在上面的语句中被重用了。这样,任何连接语句都可以简单地转换为外部连接,方法是将g. defaultifempty()中的into g from c的等价值添加到现有的连接语句中。

这就是查询(或综合)语法的亮点所在。方法(或流畅)语法显示了实际发生的情况,但很难编写:

parents.GroupJoin(children, p => p.Id, c => c.Id, (p, c) => new { p, c })
       .SelectMany(x => x.c.DefaultIfEmpty(), (x,c) => new { x.p.Value, c?.ChildValue } )

所以LINQ中的扁平外部连接是一个GroupJoin,由SelectMany扁平。

2. 保存订单

假设父母的列表稍微长一点。一些UI以固定的顺序生成一个被选中的父元素的Id值列表。让我们使用:

var ids = new[] { 3,7,2,4 };

现在,所选的父元素必须按照这个顺序从父元素列表中过滤出来。

如果我们……

var result = parents.Where(p => ids.Contains(p.Id));

... 父母的顺序将决定结果。如果父节点按Id排序,结果将是父节点2,3,4,7。不好的。但是,我们也可以使用join来筛选列表。通过使用id作为第一个列表,顺序将保持不变:

from id in ids
join p in parents on id equals p.Id
select p

结果是父母3,7,2,4。


假设你有两个不同的类:

public class Person
{
    public string Name, Email;
    
    public Person(string name, string email)
    {
        Name = name;
        Email = email;
    }
}
class Data
{
    public string Mail, SlackId;
    
    public Data(string mail, string slackId)
    {
        Mail = mail;
        SlackId = slackId;
    }
}

现在,让我们准备数据来工作:

var people = new Person[]
    {
        new Person("Sudi", "sudi@try.cd"),
        new Person("Simba", "simba@try.cd"),
        new Person("Sarah", string.Empty)
    };
    
    var records = new Data[]
    {
        new Data("sudi@try.cd", "Sudi_Try"),
        new Data("sudi@try.cd", "Sudi@Test"),
        new Data("simba@try.cd", "SimbaLion")
    };

你会注意到sudi@try.cd有两个slackid。我做这个是为了演示如何 加入工作。

现在让我们构造查询来连接Person和Data:

var query = people.Join(records,
        x => x.Email,
        y => y.Mail,
        (person, record) => new { Name = person.Name, SlackId = record.SlackId});
    Console.WriteLine(query);

在构造查询之后,你还可以像这样用foreach遍历它:

foreach (var item in query)
    {
        Console.WriteLine($"{item.Name} has Slack ID {item.SlackId}");
    }

让我们也输出GroupJoin的结果:

Console.WriteLine(
    
        people.GroupJoin(
            records,
            x => x.Email,
            y => y.Mail,
            (person, recs) => new {
                Name = person.Name,
                SlackIds = recs.Select(r => r.SlackId).ToArray() // You could materialize //whatever way you want.
            }
        ));

您将注意到GroupJoin将所有slackid放在一个组中。