本系列文章前面几篇已经总体介绍了一致性、AP的Gossip、CP的Raft。接下去咱们了解一个简单的AP协议:Distro协议。Distro是阿里巴巴的私有协议,目前流行的Nacos服务管理框架就采用了Distro协议。Distro 协议被定位为 临时数据的一致性协议 :该类型协议, 不需要把数据存储到磁盘或者数据库 ,因为临时数据通常和服务器保持一个session会话, 该会话只要存在,数据就不会丢失 。
Distro 协议保证写必须永远是成功的,即使可能会发生网络分区。当网络恢复时,把各数据分片的数据进行合并。
Distro 协议具有以下特点:
- 专门为了注册中心而创造出的协议;
- 客户端与服务端有两个重要的交互,服务注册与心跳发送;
- 客户端以服务为维度向服务端注册,注册后每隔一段时间向服务端发送一次心跳,心跳包需要带上注册服务的全部信息,在客户端看来,服务端节点对等,所以请求的节点是随机的;
- 客户端请求失败则换一个节点重新发送请求;
- 服务端节点都存储所有数据,但每个节点只负责其中一部分服务,在接收到客户端的“写”(注册、心跳、下线等)请求后,服务端节点判断请求的服务是否为自己负责,如果是,则处理,否则交由负责的节点处理;
- 每个服务端节点主动发送健康检查到其他节点,响应的节点被该节点视为健康节点;
- 服务端在接收到客户端的服务心跳后,如果该服务不存在,则将该心跳请求当做注册请求来处理;
- 服务端如果长时间未收到客户端心跳,则下线该服务;
- 负责的节点在接收到服务注册、服务心跳等写请求后将数据写入后即返回,后台异步地将数据同步给其他节点;
- 节点在收到读请求后直接从本机获取后返回,无论数据是否为最新。
Distro协议服务端节点发现使用寻址机制来实现服务端节点的管理。在Nacos中,寻址模式有三种:
- 单机模式:StandaloneMemberLookup
- 文件模式:FileConfigMemberLookup — 利用监控cluster.conf文件的变动实现节点的管理。核心代码如下:
- 服务器模式:AddressServerMemberLookup – 使用地址服务器存储节点信息,服务端节点定时拉取信息进行管理
核心代码如下:
初始全量同步
Distro协议节点启动时会从其他节点全量同步数据。在Nacos中,整体流程如下:
- 调用loadAllDataSnapshotFromRemote()方法从远程机器同步所有的数据
- 从namingProxy代理获取所有的数据data
- 构造http请求,调用httpGet方法从指定的server获取数据
- 从获取的结果result中获取数据bytes
- 处理数据processData
- 从data反序列化出datumMap
- 把数据存储到dataStore,也就是本地缓存dataMap
- 监听器不包括key,就创建一个空的service,并且绑定监听器
- 监听器listener执行成功后,就更新data store
核心代码如下:
增量同步
新增数据使用异步广播同步:
- DistroProtocol 使用 sync() 方法接收增量数据
- 向其他节点发布广播任务
- 调用 distroTaskEngineHolder 发布延迟任务
- 调用 DistroDelayTaskProcessor.process() 方法进行任务投递:将延迟任务转换为异步变更任务
- 执行变更任务 DistroSyncChangeTask.run() 方法:向指定节点发送消息
- 调用 DistroHttpAgent.syncData() 方法发送数据
- 调用 NamingProxy.syncData() 方法发送数据
- 异常任务调用 handleFailedTask() 方法进行处理
- 调用 DistroFailedTaskHandler 处理失败任务
- 调用 DistroHttpCombinedKeyTaskFailedHandler 将失败任务重新投递成延迟任务。
核心代码如下:
Distro协议是阿里的私有协议,但是对外开源框架只有Nacos。所有我们只能从Nacos中一窥Distro协议。Distro协议是一个比较简单的最终一致性协议。整体由节点寻址、数据全量同步、异步增量同步、定时上报client所有信息、心跳探活其他节点等组成。
本文中的Nacos源码版本为Nacos 1.3.2 ,属于优化过的源码,抽象出一致性协议抽象接口,和JRaft共用节点寻址模式。
林淮川
毕业于西安交通大学;奈学教育《百万架构师训练营》讲师、企业级源码内源负责人,前大树金融高级架构师、技术委员会开创者、技术总监;前天阳宏业交易事业部技术主管;多年互联网金融行业(ToB)经验。