--- title: "主节点故障检测间隔配置" date: 2026-01-12 lastmod: 2026-01-12 description: "控制主节点故障检测间隔时间的配置项说明" tags: ["集群配置", "故障检测", "高可用"] summary: "配置项作用 # cluster.fault_detection.leader_check.interval 配置项控制从节点(Follower)向主节点(Leader)发送健康检查请求的间隔时间。此配置影响集群故障检测的响应速度和网络负载。 配置项类型 # 该配置项为静态配置,需要在启动时设置,修改后需要重启节点才能生效。 默认值 # 1000ms(1秒) 是否必需 # 可选配置项(有默认值) 取值范围 # 100ms ~ 正无穷 配置格式 # # 默认配置 cluster.fault_detection.leader_check.interval: 1s # 快速检测(高可用要求) cluster.fault_detection.leader_check.interval: 500ms # 降低网络负载 cluster.fault_detection.leader_check.interval: 3s 相关配置项 # 配置项 默认值 说明 cluster.fault_detection.leader_check.interval 1s 检查间隔 cluster.fault_detection.leader_check.timeout 10s 检查超时时间 cluster.fault_detection.leader_check.retry_count 3 失败重试次数 工作原理 # 故障检测机制:" --- ## 配置项作用 `cluster.fault_detection.leader_check.interval` 配置项控制从节点(Follower)向主节点(Leader)发送健康检查请求的间隔时间。此配置影响集群故障检测的响应速度和网络负载。 ## 配置项类型 该配置项为**静态配置**,需要在启动时设置,修改后需要重启节点才能生效。 ## 默认值 ``` 1000ms(1秒) ``` ## 是否必需 **可选配置项**(有默认值) ## 取值范围 ``` 100ms ~ 正无穷 ``` ## 配置格式 ```yaml # 默认配置 cluster.fault_detection.leader_check.interval: 1s # 快速检测(高可用要求) cluster.fault_detection.leader_check.interval: 500ms # 降低网络负载 cluster.fault_detection.leader_check.interval: 3s ``` ## 相关配置项 | 配置项 | 默认值 | 说明 | |-------|-------|------| | `cluster.fault_detection.leader_check.interval` | 1s | 检查间隔 | | `cluster.fault_detection.leader_check.timeout` | 10s | 检查超时时间 | | `cluster.fault_detection.leader_check.retry_count` | 3 | 失败重试次数 | ## 工作原理 故障检测机制: ``` ┌─────────────────────────────────────────────────────────────────┐ │ 主节点故障检测流程 │ └─────────────────────────────────────────────────────────────────┘ 从节点启动 │ ▼ 按 interval 间隔发送健康检查 │ ├── 等待响应(timeout 时间) │ ├── 收到响应 → 主节点正常 │ └── 未收到响应 │ ├── 重试 retry_count 次 │ ├── 仍然失败 → 判定主节点故障 │ └── 触发选举 ``` ## 使用场景 ### 1. 默认配置(推荐) ```yaml cluster.fault_detection.leader_check.interval: 1s ``` 平衡检测速度和网络负载。 ### 2. 高可用要求 ```yaml cluster.fault_detection.leader_check.interval: 300ms cluster.fault_detection.leader_check.retry_count: 3 ``` **适用场景:** - 金融交易系统 - 关键业务系统 - 需要快速故障转移 ### 3. 降低网络负载 ```yaml cluster.fault_detection.leader_check.interval: 5s ``` **适用场景:** - 跨地域部署 - 网络带宽有限 - 稳定的生产环境 ## 推荐设置建议 | 集群类型 | 推荐间隔 | 说明 | |---------|---------|------| | 本地集群 | 500ms-1s | 快速检测 | | 同地域 | 1s | 默认配置 | | 跨地域 | 2-5s | 考虑网络延迟 | ## 故障检测时间计算 ``` 总故障检测时间 ≈ interval × retry_count 示例 1: 使用默认值 interval = 1s, retry_count = 3 故障检测时间 = 1s × 3 = 3s 示例 2: 快速检测 interval = 300ms, retry_count = 3 故障检测时间 = 300ms × 3 = 900ms ``` ## 注意事项 1. **静态配置**:修改需要重启节点 2. **与 timeout 配合**:应确保 interval < timeout 3. **网络负载**:频繁检查会增加网络流量 4. **检测速度**:间隔越短,故障检测越快 5. **集群稳定性**:合理的间隔避免频繁选举