调整 Elasticsearch 查询结果数量限制：最佳实践与替代方案

聖光之護

发布时间：2025-10-17 10:39:19

733人浏览过

来源于php中文网

原创

调整 elasticsearch 查询结果数量限制：最佳实践与替代方案

本文旨在探讨在 Java Spring Boot 应用中调整 Elasticsearch 查询结果数量限制的最佳实践。直接修改 `index.max_result_window` 可能会影响性能，因此，本文将重点介绍使用 `Search After` 进行分页查询，以及启用 `track_total_hits` 来获取准确的总命中数，从而避免潜在的性能问题，并提供代码示例和注意事项。

在 Elasticsearch 中，默认情况下，单个查询返回的结果数量限制为 10000。虽然可以通过修改 index.max_result_window 参数来提高这个限制，但这可能会对性能产生负面影响，尤其是在处理大型索引时。本文将介绍更安全、更高效的方法来处理需要返回大量结果的场景。

避免直接修改 index.max_result_window

Elasticsearch 官方文档强烈建议不要随意增加 index.max_result_window 的值。增加此值会增加 Elasticsearch 需要维护的内存资源，可能导致性能下降甚至集群不稳定。

使用 Search After 进行分页

Search After 是一种高效的分页方式，它避免了使用 from 和 size 进行深度分页时可能遇到的性能问题。 Search After 基于前一页的结果进行排序，并使用排序值作为下一页查询的起始点。

以下是一个使用 Java High Level REST Client 实现 Search After 的示例：

import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.sort.FieldSortBuilder;
import org.elasticsearch.search.sort.SortOrder;
import org.elasticsearch.search.builder.SearchSourceBuilder;

import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

public class SearchAfterExample {

    public static void main(String[] args) throws IOException {
        // 假设已经初始化了 RestHighLevelClient elsRestClient
        RestHighLevelClient elsRestClient = new RestHighLevelClient(
                // Replace with your Elasticsearch client configuration
        );

        String indexName = "your_index_name";
        int pageSize = 100; // 每页返回的结果数量
        Object[] searchAfter = null; // 第一次查询时为 null

        List<SearchHit> allHits = new ArrayList<>();

        while (true) {
            SearchRequest searchRequest = new SearchRequest(indexName);
            SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
            searchSourceBuilder.query(QueryBuilders.matchAllQuery()); // 替换为你的查询条件
            searchSourceBuilder.size(pageSize);
            searchSourceBuilder.sort(new FieldSortBuilder("_id").order(SortOrder.ASC)); // 使用 _id 进行排序，确保结果的唯一性

            if (searchAfter != null) {
                searchSourceBuilder.searchAfter(searchAfter);
            }

            searchRequest.source(searchSourceBuilder);

            SearchResponse searchResponse = elsRestClient.search(searchRequest, RequestOptions.DEFAULT);

            SearchHit[] hits = searchResponse.getHits().getHits();
            if (hits.length == 0) {
                break; // 没有更多结果
            }

            allHits.addAll(Arrays.asList(hits));

            // 获取最后一个结果的排序值，作为下一次查询的 search_after
            searchAfter = hits[hits.length - 1].getSortValues();
        }

        System.out.println("Total hits: " + allHits.size());
        // 处理 allHits 中的结果
        elsRestClient.close();
    }
}

代码解释:

初始化客户端: RestHighLevelClient 用于与 Elasticsearch 集群进行通信。
构建 SearchRequest: 指定要查询的索引名称，并使用 SearchSourceBuilder 构建查询条件。
设置排序: 使用 _id 字段进行排序，确保结果的唯一性和一致性。也可以使用其他合适的字段进行排序。
设置 search_after: 在后续查询中，将前一页最后一个结果的排序值设置为 search_after，从而实现分页。
循环查询: 循环执行查询，直到没有更多结果为止。
收集结果: 将每次查询的结果添加到 allHits 列表中。

注意事项:

Giiso写作机器人

Giiso写作机器人，让写作更简单

下载

必须选择一个具有唯一值的字段进行排序，例如 _id 或其他具有唯一约束的字段。
第一次查询时，searchAfter 必须为 null。
Search After 不适用于实时性要求高的场景，因为它不能反映数据变化。

启用 track_total_hits

默认情况下，Elasticsearch 返回的总命中数可能是不准确的，尤其是在命中数超过 10000 时。为了获取准确的总命中数，可以启用 track_total_hits 参数。

以下是一个启用 track_total_hits 的示例：

import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import org.elasticsearch.search.SearchHits;

import java.io.IOException;

public class TrackTotalHitsExample {

    public static void main(String[] args) throws IOException {
        // 假设已经初始化了 RestHighLevelClient elsRestClient
        RestHighLevelClient elsRestClient = new RestHighLevelClient(
                // Replace with your Elasticsearch client configuration
        );

        String indexName = "your_index_name";

        SearchRequest searchRequest = new SearchRequest(indexName);
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.query(QueryBuilders.matchAllQuery()); // 替换为你的查询条件
        searchSourceBuilder.trackTotalHits(true); // 启用 track_total_hits
        searchRequest.source(searchSourceBuilder);

        SearchResponse searchResponse = elsRestClient.search(searchRequest, RequestOptions.DEFAULT);

        SearchHits hits = searchResponse.getHits();
        long totalHits = hits.getTotalHits().value;

        System.out.println("Total hits: " + totalHits);

        elsRestClient.close();
    }
}

代码解释:

启用 trackTotalHits: 通过 searchSourceBuilder.trackTotalHits(true) 启用 track_total_hits 参数。
获取总命中数: 从 SearchHits 对象中获取准确的总命中数。

注意事项:

启用 track_total_hits 可能会增加查询的开销，尤其是在处理大型索引时。可以根据实际情况选择是否启用。
Elasticsearch 7.0 及更高版本支持更精确的总命中数跟踪。

总结

在 Java Spring Boot 应用中调整 Elasticsearch 查询结果数量限制时，应优先考虑使用 Search After 进行分页，并根据需要启用 track_total_hits。避免直接修改 index.max_result_window，以防止潜在的性能问题。通过合理使用这些技术，可以有效地处理需要返回大量结果的场景，并确保 Elasticsearch 集群的稳定性和性能。

如何搭建Java的定时任务环境_Quartz与Spring Task配置方法

Java 中静态锁与实例锁的线程同步行为差异详解

如何在 Java 中正确进行空值检测以避免 @Nonnull 赋值警告

Java开发如何配置JWT鉴权环境_jjwt依赖引入与Token解析

Java中如何将List转换为固定长度的数组_toArray(new String[0])的内存分配优化

相关专题

spring框架介绍

本专题整合了spring框架相关内容，想了解更多详细内容，请阅读专题下面的文章。

161

2025.08.06

Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用，涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造（CSRF）防护、会话管理与安全漏洞防范。通过实际项目案例，帮助学习者掌握如何使用 Spring Security 实现高安全性认证与授权机制，提升 Web 应用的安全性与用户数据保护。

2026.01.26

spring boot框架优点

spring boot框架的优点有简化配置、快速开发、内嵌服务器、微服务支持、自动化测试和生态系统支持。本专题为大家提供spring boot相关的文章、下载、课程内容，供大家免费下载体验。

139

2023.09.05

spring框架有哪些

spring框架有Spring Core、Spring MVC、Spring Data、Spring Security、Spring AOP和Spring Boot。详细介绍：1、Spring Core，通过将对象的创建和依赖关系的管理交给容器来实现，从而降低了组件之间的耦合度；2、Spring MVC，提供基于模型-视图-控制器的架构，用于开发灵活和可扩展的Web应用程序等。

410

2023.10.12

Java Spring Boot开发

本专题围绕 Java 主流开发框架 Spring Boot 展开，系统讲解依赖注入、配置管理、数据访问、RESTful API、微服务架构与安全认证等核心知识，并通过电商平台、博客系统与企业管理系统等项目实战，帮助学员掌握使用 Spring Boot 快速开发高效、稳定的企业级应用。

2025.08.19

Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性

Spring Boot 是一个基于 Spring 框架的 Java 开发框架，它通过约定优于配置的原则，大幅简化了 Spring 应用的初始搭建、配置和开发过程，让开发者可以快速构建独立的、生产级别的 Spring 应用，无需繁琐的样板配置，通常集成嵌入式服务器（如 Tomcat），提供“开箱即用”的体验，是构建微服务和 Web 应用的流行工具。

153

2025.12.22

Java Spring Boot 微服务实战

本专题深入讲解 Java Spring Boot 在微服务架构中的应用，内容涵盖服务注册与发现、REST API开发、配置中心、负载均衡、熔断与限流、日志与监控。通过实际项目案例（如电商订单系统），帮助开发者掌握从单体应用迁移到高可用微服务系统的完整流程与实战能力。

271

2025.12.24

Spring Boot企业级开发与MyBatis Plus实战

本专题面向 Java 后端开发者，系统讲解如何基于 Spring Boot 与 MyBatis Plus 构建高效、规范的企业级应用。内容涵盖项目架构设计、数据访问层封装、通用 CRUD 实现、分页与条件查询、代码生成器以及常见性能优化方案。通过完整实战案例，帮助开发者提升后端开发效率，减少重复代码，快速交付稳定可维护的业务系统。

2026.02.11