zookeeper 通过分层命名空间和 znode 提供分布式数据一致性解决方案。其核心功能包括配置管理、集群管理、领导者选举、分布式锁等。关键步骤为:1. 安装部署,配置 zoo.cfg 及集群参数;2. 使用客户端 api 连接服务;3. 执行 znode 的增删改查操作,支持持久、临时、顺序节点;4. 利用 watcher 监听数据变化并触发通知。znode 类型应根据数据生命周期选择,如持久节点用于长期配置,临时节点表示在线状态,顺序节点实现队列。zookeeper 采用 zab 协议保证一致性,包含 leader election 和 atomic broadcast 两个阶段,确保事务顺序执行。leader 选举基于投票机制,优先选择 zxid 最大的服务器,若相同则选 server id 较大者,半数以上投票即可当选。

Zookeeper 旨在解决分布式环境下数据一致性问题,提供配置维护、命名服务、分布式同步等功能。它像一个可靠的共享注册中心,让集群中的各个节点能够协调工作。

Zookeeper 的核心在于其分层命名空间,类似于文件系统,每个节点称为 ZNode。ZNode 可以存储数据,并可以被监控。当 ZNode 数据发生变化时,Zookeeper 会通知订阅了该 ZNode 的客户端。
Zookeeper 的典型使用场景包括:配置管理、集群管理、领导者选举、分布式锁、队列服务等。

解决方案
Zookeeper 的使用可以分为几个关键步骤:安装部署、客户端连接、ZNode 操作(创建、读取、更新、删除)、Watcher 机制。
-
安装部署:

- 下载 Zookeeper 安装包,解压到指定目录。
- 配置
zoo.cfg文件,指定数据存储目录、端口号等。 - 启动 Zookeeper 服务。如果需要搭建集群,需要配置
server.x=hostname:port1:port2。其中,x是服务器 ID,hostname是服务器主机名或 IP 地址,port1是 follower 用于连接 leader 的端口,port2是用于 leader 选举的端口。
-
客户端连接:
- 使用 Zookeeper 客户端 API(例如 Curator、zkclient)连接 Zookeeper 服务。
- 指定 Zookeeper 服务器地址和端口。
-
ZNode 操作:
-
创建 ZNode: 可以创建持久节点(PERSISTENT)、临时节点(EPHEMERAL)、顺序节点(SEQUENTIAL)。临时节点在客户端断开连接后会被自动删除。顺序节点会在节点名称后追加一个递增的序列号。例如:
create /my_node "data"创建一个持久节点/my_node,数据为"data"。create /my_node_ ephemeral sequential "data"创建一个临时顺序节点。 -
读取 ZNode 数据: 获取指定 ZNode 的数据。例如:
get /my_node。 -
更新 ZNode 数据: 修改指定 ZNode 的数据。例如:
set /my_node "new_data"。 -
删除 ZNode: 删除指定 ZNode。例如:
delete /my_node。注意,只能删除没有子节点的 ZNode。如果要删除包含子节点的 ZNode,需要递归删除。
-
创建 ZNode: 可以创建持久节点(PERSISTENT)、临时节点(EPHEMERAL)、顺序节点(SEQUENTIAL)。临时节点在客户端断开连接后会被自动删除。顺序节点会在节点名称后追加一个递增的序列号。例如:
-
Watcher 机制:
- 客户端可以注册 Watcher 监听 ZNode 的变化。
- 当 ZNode 的数据或子节点发生变化时,Zookeeper 会通知注册的 Watcher。
- Watcher 是一次性的,触发后需要重新注册。
一个简单的 Java 代码示例(使用 Curator):
import org.apache.curator.framework.CuratorFramework;
import org.apache.curator.framework.CuratorFrameworkFactory;
import org.apache.curator.retry.ExponentialBackoffRetry;
import org.apache.zookeeper.CreateMode;
public class ZookeeperExample {
public static void main(String[] args) throws Exception {
// 连接 Zookeeper
CuratorFramework client = CuratorFrameworkFactory.newClient("127.0.0.1:2181", new ExponentialBackoffRetry(1000, 3));
client.start();
// 创建 ZNode
String path = "/my_node";
if (client.checkExists().forPath(path) == null) {
client.create().creatingParentsIfNeeded().withMode(CreateMode.PERSISTENT).forPath(path, "initial_data".getBytes());
}
// 读取 ZNode 数据
byte[] data = client.getData().forPath(path);
System.out.println("Data: " + new String(data));
// 更新 ZNode 数据
client.setData().forPath(path, "updated_data".getBytes());
// 读取更新后的数据
data = client.getData().forPath(path);
System.out.println("Updated Data: " + new String(data));
// 删除 ZNode
//client.delete().guaranteed().deletingChildrenIfNeeded().forPath(path);
// 关闭连接
client.close();
}
}如何选择合适的 ZNode 类型?
ZNode 类型选择直接影响到应用的行为和数据的持久性。持久节点适合存储长期存在的配置信息,临时节点适合表示客户端的在线状态,顺序节点则方便实现分布式队列。选择时需要仔细考虑数据的生命周期和应用场景。例如,使用临时节点实现服务注册,服务下线时自动删除注册信息。
Zookeeper 如何保证数据一致性?
Zookeeper 使用 ZAB (Zookeeper Atomic Broadcast) 协议来保证数据一致性。ZAB 协议是一种基于 Paxos 算法的改进协议,它保证了所有事务的顺序一致性,即所有服务器按照相同的顺序处理事务。ZAB 协议包含两个阶段:Leader Election 和 Atomic Broadcast。Leader Election 选举出一个 Leader 服务器,负责处理客户端的写请求。Atomic Broadcast 保证 Leader 将写请求广播到所有 Follower 服务器,并确保所有服务器按照相同的顺序执行这些请求。ZAB 协议通过 Leader 选举和原子广播,保证了 Zookeeper 集群中的数据一致性。
Zookeeper 集群如何进行 Leader 选举?
Zookeeper 的 Leader 选举过程是自动进行的,通常在服务启动或 Leader 宕机时触发。选举基于 ZAB 协议,核心思想是投票。每个服务器都会投自己一票,并广播自己的投票信息。服务器会比较收到的投票信息,优先选择具有更大事务 ID (zxid) 的服务器作为 Leader。如果事务 ID 相同,则比较服务器 ID,选择 ID 较大的服务器。当超过半数的服务器投票给同一个服务器时,该服务器成为 Leader。选举过程保证了集群中只有一个 Leader,并且 Leader 具有最新的数据。











