在维护的一个30个节点左右的kafka集群,已经稳定运行了2年多,用的kafka版本是2.11-0.10版本,最近有2个节点,一直在报错,报错内容为:
Disk error while replicating data for XXX
Kafka.common.KafkaStorageException:IO exception in append to log XXX
Caused by java.io.IOException:输入输出错误。
每次报错后,节点的kafka服务就会挂掉,目前硬件巡检没有问题,在该节点上重建kafka也还是会出现上述问题,想问问大家有啥排查的思路。
你的答案