记录一次ElasticSearch Data too large故障的分析和恢复
病假在家,晚上习惯性开一下电脑看看邮件。感觉Kibana有点慢,就去看了一下ElasticSearch的console。不出意外的发现集群状态变黄了,
去腾讯后台查了一下,发现了有Data too large的报错。
去后台删除了一些有错误的索引,后发现依然有unassigned的索引,找了一下官方,说是有可能是熔断频繁导致索引allocation失败。
按照官方提供的方式将出问题的索引的 number of replicas 设置为0
不断重复多次后,故障消失。
至此整个集群恢复正常。
2022/12/31 logstash-sanofi-hybrid_rep_uat_module-2022.10.06