感谢大佬的解答。
关于第一个疑问清楚了。关于2、3当时为了使数据丢失少一些,发现这种情况后立即做出决定,开启脏主直到积压消费到可接受程度。现在仔细复盘当时情况,可能是因为KAFKA集群有一些broker还在启动中,所以查看topic情况会有-1的情况,同时复盘发现当时还有ISR为单个的情况,也印证了broker在启动中的猜想。
1、你中途停了,加上新迁移的,就变成了4个了。
2、如果已经切换Leader结束之后,脏主停不停,理论上是不会变成-1
的。
3、看看系统日志,是否有什么超时相关的信息。
因为我看不到你集群的全貌,所以,我也很难帮你判断。
但是,我猜测一下吧,迁移会产生大量的流量,而干扰了现有的集群,导致变为了-1
。