生产环境一般用的是多块SATA盘裸盘挂载
现在上层要求外面安装的Kafka集群必须使用raid5
考虑到本身Kafka有副本机制且有负载均衡的机制 感觉没什么做raid的必要
上层给的raid的优点
- 高IOPS
- 避免单盘出现数据热点
- RAID5坏一块盘业务不感知
我的理解
- 磁盘本身就是易损耗品,单盘虽不感知,坏2块盘的话RAID5就损坏了
- 即使是发现单盘并修复,仍存在换盘后的数据恢复问题,反而会拖慢IO
- Kafka本身有副本机制,再做raid没有必要
所以 想请教各位大佬 能否从更专业的角度说明下是否应该/不应该做raid5?
kafka的耐用性跟副本相关,就不在多说了(坏的的盘,有副本即可)。
kafka数据不是实施落地的,借助os自身flush及缓存来提升整体性能。(kafka团队认为副本提供的保证比同步到本地磁盘更强)
支持你的理解,抛开性能外,即使发现单盘并修复,修复后的数据已经不对称了,依靠kafka的自身副本机制即可。
参考:
https://www.orchome.com/43
https://www.orchome.com/45
https://www.orchome.com/46
你的答案