今天聊一下rockermq-operator的问题查找

因为公司内有使用 RocketMQ,在做容器化的时候,在 Github 社区了找到了一个已经不太维护的项目 rocketmq-operator, 当然也在 Dockerhub 找到了 apacherocketmq/rocketmq-operator 这个镜像,但是在对比了一下 Github 仓库的 tag 和 Dockerhub 上的这个 0.3.0-snapshot 的镜像,发现 Github 上还没有打标签,大概看了一下代码,估计是 Dockerhub 上的代码是停留在这个 commit 了。

正好在测试 Operator 的时候,同事反馈遇到扩容 broker 有问题,大概翻到了这个 issue, 细看一下,应该是 postStart 那个脚本有问题,然后先去定位一下 Operator 的代码。

定位到的代码大概是这里,会构建这个 postStart 的脚本。

从上图看,这个 nil 是不该这么插进去的,插进去之后,broker 读取 Json 文件,100%是要报错的。

然后再看看 RocketMQ 4.5 的代码,很明显,读取一个不是 Json 格式的文件,那肯定有问题的。

比如我在 RocketMQ 的单测中,加入一个测试文件,里面内容就是一个 nil,报错的信息会跟 issue, 所以基本是这里的问题了。

找到问题了,我们有几个解决的方法。

  1. 改Operator的代码,防止写入nil
  2. 改RocketMQ的代码,把nil排除

不管从哪个角度看,都是改 Operator 是更优的方法,至于怎么改,应该不用多说了,就是提前把 nil 获取,替换掉或者直接 return 就好。

正文完