我查询一个模型:

Members.objects.all()

它返回:

Eric, Salesman, X-Shop
Freddie, Manager, X2-Shop
Teddy, Salesman, X2-Shop
Sean, Manager, X2-Shop

我想要的是知道Django最好的点火方式 对我的数据库进行group_by查询,如:

Members.objects.all().group_by('designation')

当然,这是行不通的。 我知道我们可以在django/db/models/query.py上做一些技巧,但我只是好奇如何不打补丁就能做到。


当前回答

Django不支持自由分组查询。我是用一种非常糟糕的方式学会的。ORM不是设计来支持你想做的事情的,不使用自定义SQL。你被限制在:

RAW sql(即MyModel.objects.raw()) cr.执行句子(以及对结果的手工解析)。 .注解()(按句子分组在.注解()的子模型中执行,例如aggregating lines_count=Count('lines')))。

对于一个queryset,你可以调用qs.query。Group_by = ['field1', 'field2',…],但如果你不知道你在编辑什么查询,也不能保证它会工作,不会破坏QuerySet对象的内部结构,这是有风险的。此外,它是一个内部的(未被记录的)API,你不应该直接访问,否则会有代码与未来的Django版本不再兼容的风险。

其他回答

这有点复杂,但让提问者他/她期望只有一个DB命中。

from django.db.models import Subquery, OuterRef

member_qs = Members.objects.filter(
    pk__in = Members.objects.values('designation').distinct().annotate(
        pk = Subquery(
          Members.objects.filter(
            designation= OuterRef("designation")
        )
        .order_by("pk") # you can set other column, e.g. -pk, create_date...
        .values("pk")[:1]
        ) 
    )
   .values_list("pk", flat=True)
)

出于某种原因,上面提到的解决方案并不适合我。这是有效的方法:

dupes_query = MyModel.objects.all().values('my_field').annotate(
    count=Count('id')
).order_by('-count').filter(count__gt=1)

我希望这能有所帮助。

如果你想要模型对象,而不仅仅是简单的值或字典,你可以这样做:

members = Member.objects.filter(foobar=True)
designations = Designation.objects.filter(member__in=members).order_by('pk').distinct()

将member__in替换为模型名的小写版本,后跟__in。例如,如果您的模型名称是Car,则使用car__in。

你需要做自定义SQL的例子在这段代码:

自定义SQL通过子查询

或者在Django在线文档中所示的自定义管理器中:

添加额外的Manager方法

你也可以使用python内置的itertools。groupby直接:

from itertools import groupby

designation_key_func = lambda member: member.designation
queryset = Members.objects.all().select_related("designation")

for designation, member_group in groupby(queryset, designation_key_func):
    print(f"{designation} : {list(member_group)}")

不需要原始sql、子查询、第三方库或模板标签,在我看来是python化的和显式的。