作为一名拥有多年分布式系统架构经验的技术负责人,我曾是 Elasticsearch 的忠实用户。然而,在 2024 年我们团队做出了一个重大决定:将核心搜索业务从 Elasticsearch 迁移至国产的 Easysearch。这次迁移不仅是一次技术栈的更换,更是我们对技术自主可控战略的深刻实践。
一、放弃 Elasticsearch 的核心原因 #
1.1 开源协议变更带来的风险 #
Elasticsearch 最初采用 Apache 2.0 开源协议,这也是它能够迅速占领市场的重要原因。然而,2021 年初 Elastic 公司决定将开源协议变更为 SSPL 和 Elastic License 双重许可。更令人担忧的是,Elastic 公司于 2021 年退出中国直销市场,国内企业在获取官方技术支持、许可合规等环节面临挑战。
1.2 安全能力不足与数据泄露风险 #
在实际使用中,我们发现 Elasticsearch 免费版本缺乏企业级安全功能。虽然支持用户认证,但对密码复杂度、密码更换周期没有任何限制。过去几年内,Elasticsearch 数据泄露事件频发,甚至一个月被曝 6 次数据泄露。根据 Group-IB 报告,2021 年网络上暴露的 Elasticsearch 实例超过 10 万个,约占当年暴露数据库总数的 30%。
此外,若用户想集成企业现有认证系统、使用高级权限控制或搭建容灾系统,都必须购买昂贵的许可才能获得相应的功能支持。
1.3 信创自主可控要求 #
在信创、自主可控的背景下,原技术架构中的 Elasticsearch 搜索引擎,因其开源协议变更带来的供应链安全隐患、核心技术依赖国外、国产化环境适配不足等问题,已不符合信创战略与企业安全合规要求。
二、为什么选择 Easysearch 作为替代方案 #
2.1 高度兼容性降低迁移成本 #
Easysearch 与 Elasticsearch 的高度兼容性是替代方案的基石。 Easysearch 完全兼容 Elasticsearch 的 Query DSL 和 REST API,并支持直接使用后者的各类官方客户端。因此,应用程序仅需调整连接配置,将端点指向 Easysearch 集群,即可完成接入,无需修改核心业务代码。
2.2 卓越的性能表现 #
在实际测试中,Easysearch 展现出显著的性能优势。在相同硬件配置下,使用公司日志进行 bulk 写入压测,Easysearch 在多种分片调整下的写入性能相比 Elasticsearch 7.10.2 提升 40%-70% 。
同时,Easysearch 存储压缩率相比 Elasticsearch 平均高出 2 倍,直接节省磁盘空间 50% 以上,显著降低了硬件资源成本。
2.3 强大的中文处理能力 #
作为专为中文环境打造的搜索引擎,Easysearch 在中文信息处理方面具备显著优势。它内置了高性能的中文分词器,支持拼音搜索、同义词扩展和模糊查询,还提供 API 接口维护词典。显著提升了中文检索的精准度和用户体验。
2.4 全面的国产化适配 #
Easysearch 在国产化适配方面构建了完善的技术体系,已全面兼容主流国产 CPU 架构(包括飞腾、鲲鹏、海光、龙芯、申威、兆芯等)和国产操作系统(如统信 UOS 、银河麒麟、开源欧拉),并通过了相应的信创产品兼容性认证。这一适配能力使其能够在从芯片到操作系统的全栈国产化环境中稳定运行,解决了国外同类产品在信创环境下可能出现的兼容性差、维护困难等痛点。
三、迁移实践:策略与执行 #
3.1 迁移前的评估与规划 #
我们采取了分阶段迁移策略,首先在非核心业务系统进行试点。通过详细的兼容性测试,验证了 Easysearch 对我们现有业务的支撑能力。
环境评估:分析现有 Elasticsearch 集群的规模、配置和数据量。
并行部署:搭建 Easysearch 测试环境,进行功能验证。
数据迁移:使用快照恢复或实时同步工具迁移数据。
3.2 迁移过程中的关键技术决策 #
在迁移过程中,我们充分运用了 Easysearch 与 Elasticsearch 的高度兼容性,并针对不同业务集群的数据规模、停机时间窗口和网络环境,制定了差异化的迁移策略。
快照兼容版本:通过全量、增量快照进行数据迁移,简单、高效。
快照不兼容版本:通过 Easysearch 配套迁移工具迁移,可通过 UI 界面分批次对索引进行迁移。此外,还提供了数据校验功能,为迁移工作顺利进行提供了有力保障。
3.3 迁移后的优化与调优 #
迁移完成后,我们根据 Easysearch 的特点进行了针对性优化:
运维与安全加固:使用 INFINI Console 对集群进行全面的监控与告警管理,涵盖了从集群健康度、节点资源到查询性能等关键指标。在安全方面,我们启用了 TLS 加密,并与企业的 LDAP/AD 认证系统进行集成,满足了内部的安全合规要求。
存储压缩优化:应用了 Easysearch 内置的 ZSTD 压缩算法,此项优化使索引的磁盘占用相比优化前降低了约 50%,有效控制了存储成本。对于日志、审计类等非实时高频查询的历史数据,我们采用了可搜索快照功能,将数据备份至成本更低的对象存储(如 S3),进一步释放了本地磁盘空间。
索引配置优化:根据业务特点调整分片策略和副本数量。
四、迁移后的收益与价值 #
4.1 成本效益显著提升 #
迁移完成后,我们在总拥有成本上实现了多维度的优化。在硬件与存储层面,Easysearch 通过采用 ZSTD 压缩算法,使得索引的磁盘占用相比迁移前显著降低。在实际案例中,一个原占用 279GB 的索引,迁移后体积降至 138GB ,缩减比例约 50% 。可搜索快照功能允许我们将冷数据备份至成本更低的对象存储(如 S3),进一步释放了本地高性能存储资源。此外,总体的节点数量和主机数量相比以前都有所降低,相应地在运维方面投入的人力、精力也有所优化。
4.2 运维效率大幅提高 #
Easysearch 显著降低了日常运维的复杂度和技术门槛。其内置的 Web UI 管理控制台提供了类似 Kibana 的核心功能,支持索引管理、查询调试和权限控制,使开发与运维人员无需深入命令行即可完成大部分常规操作。同时, INFINI Console 作为一款轻量级的跨集群治理平台,实现了对多个 Easysearch 集群的统一监控、管理和告警,将运维人员从在不同集群控制台间频繁切换的繁琐工作中解放出来,管理效率提升显著。
4.3 安全合规能力增强 #
在安全与合规层面,Easysearch 提供了全面的企业级安全能力。在基础安全方面,它开箱即启用用户认证和 TLS 加密通信,支持与企业内部 LDAP/AD 目录服务集成,并支持字段级、文档级的权限控制,为数据安全构建了全方位防护。在审计与合规层面,其内置的审计功能可以详细记录数据访问和操作日志,满足审计追溯的要求。
五、经验总结与建议 #
经过一年多的生产环境验证,我认为 Easysearch 已经成熟到可以承担企业核心搜索业务的程度。对于正在考虑 Elasticsearch 国产化替代的架构师同行,我提出以下建议:
尽早进行概念验证:针对自身业务场景开展测试,评估替代可行性。
制定渐进式迁移路线:从非核心业务开始,积累经验后再推广。
建立完善的监控体系:利用 INFINI Console 等工具实现集群全面监控。
技术选型不仅是技术决策,更是战略决策。放弃 Elasticsearch 转向 Easysearch,让我们在技术自主可控的道路上迈出了坚实的一步。在当今复杂多变的国际环境下,拥有自主可控的技术栈无疑为企业长期发展增添了更多确定性。





