我试图建立一个我正在建立的Django网站的搜索,在这个搜索中,我用三种不同的模式进行搜索。为了在搜索结果列表上进行分页,我想使用一个通用的object_list视图来显示结果。但要做到这一点,我必须将三个查询集合并为一个。

我该怎么做?我已经试过了:

result_list = []
page_list = Page.objects.filter(
    Q(title__icontains=cleaned_search_term) |
    Q(body__icontains=cleaned_search_term))
article_list = Article.objects.filter(
    Q(title__icontains=cleaned_search_term) |
    Q(body__icontains=cleaned_search_term) |
    Q(tags__icontains=cleaned_search_term))
post_list = Post.objects.filter(
    Q(title__icontains=cleaned_search_term) |
    Q(body__icontains=cleaned_search_term) |
    Q(tags__icontains=cleaned_search_term))

for x in page_list:
    result_list.append(x)
for x in article_list:
    result_list.append(x)
for x in post_list:
    result_list.append(x)

return object_list(
    request,
    queryset=result_list,
    template_object_name='result',
    paginate_by=10,
    extra_context={
        'search_term': search_term},
    template_name="search/result_list.html")

但这行不通。当我尝试在通用视图中使用该列表时,会出现错误。列表缺少克隆属性。

如何合并page_list、article_list和post_list这三个列表?


当前回答

将查询集连接到列表中是最简单的方法。如果所有查询集都会命中数据库(例如,因为结果需要排序),这不会增加更多成本。

from itertools import chain
result_list = list(chain(page_list, article_list, post_list))

使用itertools.chain比循环每个列表并逐个附加元素更快,因为itertools是在C中实现的。它还比在串联之前将每个查询集转换为列表消耗更少的内存。

现在可以按日期(如hasen j对另一个答案的评论所要求的)对结果列表进行排序。sorted()函数方便地接受生成器并返回列表:

result_list = sorted(
    chain(page_list, article_list, post_list),
    key=lambda instance: instance.date_created)

如果您使用的是Python 2.4或更高版本,则可以使用attrgetter而不是lambda。我记得读过关于它更快的文章,但我没有看到一百万个项目列表有明显的速度差异。

from operator import attrgetter
result_list = sorted(
    chain(page_list, article_list, post_list),
    key=attrgetter('date_created'))

其他回答

这里有一个想法。。。只需从三个人中的每一个人中抽出一整页的结果,然后扔掉20个最不有用的结果。。。这消除了大型查询集,这样只会牺牲一点性能,而不会牺牲很多性能。

将查询集连接到列表中是最简单的方法。如果所有查询集都会命中数据库(例如,因为结果需要排序),这不会增加更多成本。

from itertools import chain
result_list = list(chain(page_list, article_list, post_list))

使用itertools.chain比循环每个列表并逐个附加元素更快,因为itertools是在C中实现的。它还比在串联之前将每个查询集转换为列表消耗更少的内存。

现在可以按日期(如hasen j对另一个答案的评论所要求的)对结果列表进行排序。sorted()函数方便地接受生成器并返回列表:

result_list = sorted(
    chain(page_list, article_list, post_list),
    key=lambda instance: instance.date_created)

如果您使用的是Python 2.4或更高版本,则可以使用attrgetter而不是lambda。我记得读过关于它更快的文章,但我没有看到一百万个项目列表有明显的速度差异。

from operator import attrgetter
result_list = sorted(
    chain(page_list, article_list, post_list),
    key=attrgetter('date_created'))

如果要链接大量查询集,请尝试以下操作:

from itertools import chain
result = list(chain(*docs))

其中:docs是查询集的列表

当前方法的一个大缺点是它对大型搜索结果集的效率低下,因为每次都必须从数据库中删除整个结果集,即使您只打算显示一页结果。

为了只从数据库中提取实际需要的对象,必须对QuerySet而不是列表使用分页。如果这样做,Django实际上会在执行查询之前对QuerySet进行切片,因此SQL查询将使用OFFSET和LIMIT来只获取实际显示的记录。但是,除非您能够以某种方式将搜索塞进一个查询中,否则无法做到这一点。

既然您的三个模型都有标题和正文字段,为什么不使用模型继承?只需让所有三个模型都继承自具有标题和正文的共同祖先,并作为对祖先模型的单个查询执行搜索。

您可以使用Union:

qs = qs1.union(qs2, qs3)

但是如果您想对组合查询集的外部模型应用order_by。。。那么你需要事先这样选择它们。。。否则它不会起作用。

实例

qs = qs1.union(qs2.select_related("foreignModel"), qs3.select_related("foreignModel"))
qs.order_by("foreignModel__prop1")

其中prop1是外国模型中的属性。