排序 + 搜索一起用，Easysearch 性能会怎样变化 | Easysearch | 分布式搜索型数据库 | INFINI Labs

📣 极限科技诚招搜索运维工程师（Elasticsearch/Easysearch）- 全职/北京 👉 : 立即申请加入

功能
AI 搜索 / 检索
全文检索
高性能可扩展的全文搜索能力

语义搜索
理解意图，不只匹配关键词

向量搜索
基于向量相似度的高召回检索

多模态搜索
视频、图片等内容统一搜索

地理空间位置检索
基于空间位置的范围与距离检索
数据分析
规则引擎
基于规则的实时判断与触发

聚合引擎
海量数据的高效聚合计算

个性化推荐
基于行为与画像的智能推荐
高可用与大规模架构
分布式架构
原生分布式，支持水平扩展

跨集群搜索
多集群数据统一检索与聚合

跨集群复制
跨集群数据复制与容灾

异步搜索
大查询不阻塞在线请求

快照搜索
直接基于备份数据进行查询
扩展与生态
插件管理
统一管理与配置扩展能力

第三方集成
快速对接主流系统与服务
安全与合规
安全登录
支持多种安全认证机制

管理用户和角色
灵活的权限与角色控制

数据加密与脱敏
保护敏感数据安全

细粒度权限治理
文档级 / 字段级权限控制

国密与国产化
符合国密与合规要求
解决方案
场景
企业搜索

日志与可观测性

应用搜索

文档搜索

网站搜索

视觉搜索

语音搜索

知识库
行业案例
金融

能源

汽车

电商与零售

媒体

教育
迁移
从 Elasticsearch 迁移到 Easysearch
从 OpenSearch 迁移到 Easysearch
所有解决方案
案例
企业案例

行业案例
金融

能源

汽车

电商与零售
carousel
Easysearch：助力中国一汽降本增效
 助力移动云实现 Elasticsearch 国产化替代与云原生升级
 INFINI Console：助力人保 ES 集群平滑升级，保障业务零中断
所有案例
资源
文档中心
了解 Easysearch 产品特性

博客文章
分享、交流、成长

下载安装
获取并快速部署 Easysearch

知识库
汇集文档、指南与常见问题

白皮书
权威技术说明与行业实践参考
carousel
Easysearch v1.0 搜索型数据库基础能力检验报告

INFINI Easysearch 国产替代方案 v1.0

Elasticsearch VS Easysearch 性能测试报告

400-139-9200

一、Easysearch 排序（sort）核心原理 #

Easysearch 的排序机制基于 Lucene 底层实现，针对分布式场景和时序数据特点做了深度优化，核心为两阶段高效执行流程，无中间结果冗余存储：

检索阶段：通过倒排索引完成关键词匹配，筛选符合条件的文档集合，生成初步结果集（默认按相关性得分_score排序）；分片仅返回文档 ID 和排序字段值（而非完整文档），协调节点无需存储冗余中间数据，保障流程轻量化。
排序阶段：当用户指定自定义排序字段（如时间戳、数值型字段）时，系统读取该字段的 doc values 列式存储结构，对分片返回的结果集进行全局聚合排序，最终返回有序结果。

核心优化设计 #

流水线执行：检索与排序流程无缝衔接，减少流程切换开销，提升整体执行效率；
时序预排序索引：默认启用时序场景优化，自动适配时间戳字段的预排序结构，减少排序计算量；
排序裁剪逻辑：针对大数据量场景优化结果集筛选策略，避免全量排序带来的性能损耗。

二、doc values：排序性能的底层支撑 #

1. 本质与作用 #

Doc values 是 Easysearch 为支持高效排序、聚合操作设计的列式存储结构，与倒排索引形成功能互补：

倒排索引优化 “关键词→文档” 的检索效率，doc values 优化 “文档→字段值” 的读取效率；
除 text 类型外，所有字段默认启用 doc values，按列存储字段值，支持快速随机访问和批量读取，为排序提供底层性能保障。

2. 关键优化特性 #

存储优化：2.0.0 版本后将段元数据迁移至堆外内存，降低 JVM 堆压力，减少 GC 频率（Young GC 次数减少 18.86%，GC 时间减少 3.40%）；
访问加速：针对排序场景优化数据读取路径，支持按排序方向（升序 / 降序）预读取相邻数据，IO 开销降低 30% 以上；
兼容性保障：保持对主流字段类型的全面支持，无需额外配置即可享受高效排序能力。

三、排序 + 搜索的性能变化：从数据看优化幅度 #

1. 核心性能指标提升（基于 Easysearch 2.0.0 版本测试） #

排序 + 搜索场景的性能优化集中体现在时序数据场景，延迟降低效果显著：

时间戳降序排序（desc_sort_timestamp）：50 分位延迟从 516.07ms 降至 98.89ms（优化 80.84%），99 分位延迟从 603.14ms 降至 139.93ms（优化 76.80%）；
时间戳升序 + After 分页（asc_sort_with_after_timestamp）：50 分位延迟从 1272.58ms 降至 33.56ms（优化 97.36%），100 分位延迟从 111.42ms 降至 39.35ms（优化 64.68%）；
强制合并（force-merge）后：单段索引的时间戳降序排序 50 分位延迟仅 115.01ms，较旧版本 131617ms（约 2 分钟）优化 99.91%。

2. 性能提升的核心原因 #

堆外内存管理：段元数据脱离 JVM 堆存储，避免 GC 停顿对排序执行的干扰，保障高并发场景下的性能稳定性；
时序预排序优化：默认对时间戳字段启用预排序索引结构，直接减少排序阶段的计算量；
After 分页深度优化：针对游标分页场景优化结果集裁剪逻辑，仅处理必要数据，避免全量排序开销；
doc values 访问优化：按排序方向预读取数据，减少跨分片 IO 往返，提升字段值读取效率。

3. 资源占用表现 #

磁盘存储：排序字段的 doc values 未增加额外存储负担，2.0.0 版本总存储量较 1.15.6 版本减少 1.93%；
内存使用：堆外内存存储使排序过程的内存占用更稳定，高并发场景下 99.9 分位延迟优化 43.40%；
Merge 开销：排序优化伴随 Merge 次数增加 4.35%，可通过index.merge.scheduler.max_thread_count参数调整，平衡读写性能。

四、实际应用建议 #

字段选择：优先使用数值型、日期型字段排序（doc values 访问效率最高），避免对 text 类型字段排序（性能较差，需禁用 fielddata）；
分页方式：大数据量排序场景推荐使用search_after游标分页，性能较传统from/size分页提升 97% 以上；
版本选择：升级至 Easysearch 2.0.0 + 版本，充分享受堆外内存存储、时序预排序等核心优化；
索引优化：对高频排序字段的索引执行 force-merge 操作，减少段数量，进一步降低排序延迟；
参数调优：若遇到 Merge 开销过高问题，可适当调整index.merge.scheduler.max_thread_count参数，平衡排序性能与 Merge 资源占用。

标签

排序性能性能优化时序数据