0

0

【译】zookeeper:一个用于分布式系统的分布式协作服务程序

php中文网

php中文网

发布时间:2016-06-07 16:39:32

|

1154人浏览过

|

来源于php中文网

原创

ZooKeeper是一个用于分布式应用程序的分布式开源协调服务。它使用一组简单的操作原语,使得分布式应用可以实现更高层次的服务——如同步、配置维护、群组和命名管理等。它以易于编程为基本设计理念,并使用了一个类似于文件系统目录结构风格的数据模型。ZooK

    ZooKeeper是一个用于分布式应用程序的分布式开源协调服务。它使用一组简单的操作原语,使得分布式应用可以实现更高层次的服务——如同步、配置维护、群组和命名管理等。它以易于编程为基本设计理念,并使用了一个类似于文件系统目录结构风格的数据模型。ZooKeeper服务运行于Java环境中并可以在Java和C中使用。
   众所周知,协调服务很难达到正确,尤其会出现竞争条件或死锁等问题。ZooKeeper设计初衷是为了缓解分布式应用从设计到实现中协调服务的问题。

设计目标

   ZooKeeper的实现简单。它使得分布式进程与其他进程通过一个共享的层级的命名空间(类似于标准文件系统目录的)来进行协调。命名空间由被称为znode的数据注册表(类似文件系统中的文件和目录)组成。而与面向数据存储的文件系统不同的是, ZooKeeper将数据保持在内存中,这意味着ZooKeeper有更大的吞吐量和更小的延时。
   ZooKeeper是冗余的。就像它所协调的分布式进程一样,ZooKeeper自身实现了一些主机间复制并成为一个集群整体。
zkservice
   组成ZooKeeper服务的这些服务器必须相互连通。它们通过事务日志和持久化存储上的快照来维护一个状态的内存镜像。只要大多数服务可用,ZooKeeper服务就可用。
   客户端连接到一个ZooKeeper服务器,它维持一个发送请求、接受应答、获取监听时间并发送心跳信息的TCP连接。如果这个连接中断,客户端会连到其他的服务器。
   ZooKeeper是有序的。Zookeeper会以反映ZooKeeper全局事务序列的数值标记每次更新操作,后续的操作可以使用这个序列来实现高层的抽象,例如同步原语。
   ZooLeeper是高效的。尤其是在读写比很大的情况下。ZooKeeper的应用运行在数千台服务器上,它的应用表现会在这种读多写少的场景下表现良好(读写比大约会在10:1)。

数据模型和层级命名空间

   ZooKeeper提供的命名空间和标准文件系统很像。一个名字是以(/)分割路径元素组成的序列。每个Zookeeper明明空间中的节点都通过路径被识别。
zknamespace

节点和临时节点

   和标准文件系统不同的是,每一个ZooKeeper命名空间中的节点和它们的子节点一样拥有数据,这就像一个文件也可以作为目录的文件系统。(ZooKeeper被设计用于存储协调数据:状态信息、配置、位置信息等。所以每个节点存储的数据通常很小,大约在字节到千字节级别)。我们称ZooKeeper的数据节点为znode。
   Znode维护一个统计结构(包含了数据改变的版本号,访问控制列表改变和时间戳)来允许缓存验证和协调更新。每次znode数据改变,版本号会递增。例如,当客户但获取数据时它也会接受数据的版本信息。
   命名空间中每个znode存储的数据的读写都是原子操作。读操作会得到一个znode相关的所有数据字节,写操作替换znode相关的所有数据。每一个节点都有一个访问控制列表来限制谁有权限能做什么。
   ZooKeeper中也有临时节点的概念,这些节点会在创建这些节点的会话有效时存在,当会话结束后被删除。临时节点在你想要实现一些特定操作时([tdb]原文未补全)时非常有用。

竞争更新和监听

   zookeeper支持监听(watches)的概念。客户端可以在znode上设置一个监听,一个监听可以在znode被改变后触发和删除。当一个监听触发后,客户端接受一个通知znode改变的数据包。并且如果客户端和zookeeper中一个服务器之前的连接出现故障,客户端会收到一个本地通知,这些可以用于一些可高可用性的服务实现([tdb]此处原文未补全)。

保证

   ZooKeeper非常简单高效。虽然它的设计目标是建立的更复杂的服务(例如同步)的基础,它提供了一些保证机制:
顺序一致:通过客户端的更新会以他们发出操作的顺序来应用。
原子性:无论更新是否成功,不存在部分更新。
单一系统镜像:无论一个客户端连到哪一个服务器,会看到服务的相同视图。
可靠性:一旦一个更新被应用,这次更新会从这个时刻开始持久化直到下次客户端覆盖这次更新的内容。
及时性:系统的客户端视图保证在一个确定时候限度内是最新的。
更多信息可以参考官方文档、白皮书。([tdb])

简单API

   ZooKeeper的设计目标之一是提供一个非常简单的编程接口,所以它只提供了下面的操作:
create – creates a node at a location in the tree
delete – deletes a node
exists – tests if a node exists at a location
get data – reads the data from a node
set data – writes data to a node
get children – retrieves a list of children of a node
sync – waits for data to be propagated
关于这些内容的更多讨论,以及使用它们如何实现高层的操作,请参考官方文档。([tdb])

实现

   Zookeeper组件展示了ZooKeeper服务的高层组件。除了请求处理器之外, 组成zookeeper服务的每个server都会在本地备份每一个组件的拷贝。
zkcomponents
   这个被复制的数据库是一个包含内存全部数据的树型内存数据库。更新操作会写入磁盘并用于恢复,写入操作会在应用到内存数据库之前序列化到磁盘中。
   每一个ZooKeeper数据库都可以用于客户端的连接,客户端连接到一个服务器上去提交请求。读请求可以在每一个服务器数据库的复制片中获取,而改变服务状态的请求和写请求则通过一个一致性协议进行。
   作为一致性协议的一部分,所有来自客户端的写请求会流入一个单一的服务器——称为领导者(leader),剩余的ZooKeeper服务器称为追随者(followers),它们从领导者上接收消息提议并对消息传递达成一致性意见。消息传递层会(the messaging layer)处理当领导者故障时选举新的领导者,以及追随者和领导者之前的同步。
   ZooKeeper使用一个定制的原子消息传递协议,由于消息传递层是原子操作,ZooKeeper能保证本地复制篇不会产生偏离。当领导者接收一个读请求时,它会计算系统的状态到应用写入被应用的时刻,并将系统状态转换到新的事务状态。

使用

   Zookeeper的编程接口非常简单。然而使用这些API,你可以实现高层的操作(例如同步原语、组成员、所有权等)。更多分布式应用的操作可以参考白皮书和视频资料([tdb])。

AI Web Designer
AI Web Designer

AI网页设计师,快速生成个性化的网站设计

下载

性能

   ZooKeeper被设计初衷是高性能。但真的如此么?Yahoo研究中心的ZooKeeper开发团队证实了ZooKeeper的高性能,特别是在读多写少的应用中(见下图),因为写操作需要在所有ZooKeeper服务器间同步状态。(读多写少是协调服务的典型应用情况)
zkperfRW-3.2
   图为两个2GHz至强处理器和两个SATA 15K RPM驱动器的服务器上ZooKeeper 3.2运行时的吞吐量。一个磁盘驱动器作为ZooKeeper日志的专用设备。快照写入到操作系统所在的磁盘驱动器。读写操作都操作1KB的数据。图   中“Servers”指的是ZooKeeper服务的大小,即组成服务的服务器个数。客户端通过大约30个其他服务器来模拟。ZooKeeper集群配置不允许客户端连接到领导者。
提示:3.2版的r/w性能是3.1版的2倍。
   上面基准测试也表明ZooKeeper是可靠的。下图显示了ZooKeeper在各种失败情况下的反应。图中标记的各个事件是:
1.追随者失败和恢复
2.另一个追随者失败和恢复
3.领导者失败
4.两个追随者失败和恢复
5.另一个领导者失败

可靠性

   为展示当节点失败发生时系统的行为,我们在一个由7台机器组成的ZooKeeper服务上运行和上节一样的基准测试,但这次我们将写操作的百分比固定为30%,这是预期负载比例的保守估计。
zkperfreliability
   此图有几处值得仔细观察。首先,如果追随者失败后快速恢复,则ZooKeeper可以维持高吞吐率。但更重要的是,领导者的选举算法让系统可以很快地恢复,以避免吞吐率有实质性下降。据我们观察,ZooKeeper集群在选举一个新的领导者的时间小于200ms。第三,一旦追随者恢复并且开始处理请求,ZooKeeper可以恢复高吞吐率。

ZooKeeper 项目

   ZooKeeper已经在很多工业应用中被成功使用。Yahoo!在Yahoo! Message Broker中使用ZooKeeper作为协调和故障恢复服务。Yahoo! Message Broker是一个高度扩展的发布-订阅系统(目前主流的kfaka也使用ZooKeeper),管理着成千上万个需要拷贝和数据传递的话题。Yahoo!的很多广告系统也使用ZooKeeper来实现可靠服务。
我们鼓励用户和开发者加入社区。更多信息请看Apache的ZooKeeper项目。

相关文章

keep
keep

Keep是一款健身安排,无论是想减肥塑形或增肌,还是寻找健身跑步瑜伽计步等训练计划,你可以随时随地选择课程进行训练!权威教练视频教学,健身干货自由分享!有需要的小伙伴快来保存下载体验吧!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

46

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

178

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

51

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

92

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

227

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

532

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

171

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Apache Storm教程手册
Apache Storm教程手册

共11课时 | 8万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.6万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号