📣 极限科技诚招搜索运维工程师(Elasticsearch/Easysearch)- 全职/北京 👉 : 立即申请加入

配置项作用 #

indices.recovery.retry_delay_network 配置项控制因网络相关问题导致分片恢复失败后的重试延迟时间。网络问题包括连接超时、网络中断、传输层故障等。

配置项类型 #

该配置项为动态配置,可以在运行时通过集群设置 API 进行修改。

默认值 #

5s

是否必需 #

可选配置项(有默认值)

取值范围 #

0 ~ 正无穷

配置格式 #

# 默认配置
indices.recovery.retry_delay_network: 5s

# 增加重试延迟
indices.recovery.retry_delay_network: 10s

# 减少重试延迟
indices.recovery.retry_delay_network: 2s

# 快速重试
indices.recovery.retry_delay_network: 1s

相关配置项 #

配置项默认值说明
indices.recovery.retry_delay_state_sync500ms状态同步重试延迟
indices.recovery.retry_delay_network5s网络问题重试延迟
indices.recovery.max_concurrent_operations1最大并发恢复操作数

工作原理 #

网络重试机制:

┌─────────────────────────────────────────────────────────────────┐
│                    网络重试机制                                  │
└─────────────────────────────────────────────────────────────────┘

分片恢复请求
    │
    ▼
检查网络连接
    │
    ├── 网络正常
    │   │
    │   └── 继续恢复操作
    │
    └── 网络异常
         │
         ├── 连接超时
         ├── 网络中断
         ├── 传输层故障
         └── 节点不可达
              │
              ▼
         等待 retry_delay_network
              │
              └── 重试恢复操作

使用场景 #

1. 默认配置(推荐) #

indices.recovery.retry_delay_network: 5s

适用于大多数集群配置。

2. 快速恢复环境 #

indices.recovery.retry_delay_network: 1s

适用场景:

  • 稳定的内网环境
  • 快速故障检测
  • 需要快速恢复

3. 不稳定网络环境 #

indices.recovery.retry_delay_network: 10s

适用场景:

  • 跨地域部署
  • 网络不稳定
  • 避免频繁重试

4. 高延迟网络 #

indices.recovery.retry_delay_network: 15s

适用场景:

  • 高延迟网络
  • 公网部署
  • 容忍网络抖动

推荐设置建议 #

网络环境推荐延迟说明
稳定内网1-3s快速恢复
标准5s默认配置
跨地域10-15s考虑延迟
不稳定10-20s避免风暴

与 retry_delay_state_sync 的区别 #

特性retry_delay_state_syncretry_delay_network
默认值500ms5s
触发条件状态同步问题网络问题
典型场景节点注册、分片启动连接超时、网络中断
重试策略快速重试慢速重试
原因类型集群状态不一致网络层故障

动态配置示例 #

# 更新集群配置
PUT /_cluster/settings
{
  "transient": {
    "indices.recovery.retry_delay_network": "10s"
  }
}

# 临时快速重试
PUT /_cluster/settings
{
  "transient": {
    "indices.recovery.retry_delay_network": "2s"
  }
}

注意事项 #

  1. 动态更新:此配置为动态配置,可在线修改
  2. 较长延迟:相比状态同步,网络问题需要更长的恢复时间
  3. 避免频繁重试:过小的值可能导致网络重试风暴
  4. 与网络环境相关:根据网络稳定性和延迟调整
  5. 平衡恢复速度:权衡恢复速度和系统负载