0

0

官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake

碧海醫心

碧海醫心

发布时间:2024-11-28 20:12:42

|

1114人浏览过

|

来源于机器之心

转载

2024年6月,国内领先的大模型应用kimi携手清华大学madsys实验室,联合发布了基于kvcache的大模型推理架构mooncake。该架构通过pd分离和存算一体化设计,显著提升了kimi智能助手的推理吞吐量,并有效降低了推理成本,引发业界广泛关注。近日,清华大学、9#aisoft研究组织及阿里云等多家企业和机构正式开源mooncake大模型资源池化项目,旨在构建高性能推理框架的开源生态,邀请更多厂商和开发者共同参与。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake

依托清华大学创新研究计划(AIR)项目,阿里云与清华大学合作探索大模型资源池化技术在工业界的应用,并取得了丰硕成果。为加速大模型推理技术发展,特别是推理实例共享缓存池化层的标准化,双方深度合作开发Mooncake项目,整合主流大模型推理框架,抽象缓存池化层的底层接口,构建高效的分布式资源解耦架构,并针对大模型场景进行深度优化,提升超长上下文推理性能。

作为AI基础设施提供商,阿里云为Mooncake项目贡献了传输引擎(Transfer Engine)、点对点存储(P2P Store)和高性能内存存储等关键组件的代码。在推理框架层面,实现了与主流框架vLLM的适配,显著提升了推理性能,并为其他框架的对接提供了参考,推动了大模型资源池化技术的落地。阿里云还提供了自研eRDMA网络的底层传输路径,并计划支持CXL,方便用户在云端快速部署。

清华大学MADSys实验室章明星教授指出,Mooncake充分利用AI基础设施中的CPU、内存和SSD资源,提升推理速度,并通过资源解耦架构实现不同推理实例间的缓存共享,减少资源浪费。开源Mooncake旨在促进产学研合作,推动大模型推理系统发展。

磁力开创
磁力开创

快手推出的一站式AI视频生产平台

下载

未来,阿里云将持续深化Mooncake项目的参与,与更多企业、机构和高校合作,探索更高效的模型推理架构,推动大模型技术普惠各行各业。

Mooncake项目开源地址:https://www.php.cn/link/95a372b63ab8641f092e77acc9bf468c

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

328

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

235

2023.10.07

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1099

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

189

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1428

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

17

2026.01.19

github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

763

2026.01.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2071

2024.08.16

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Node.js 教程
Node.js 教程

共57课时 | 9.5万人学习

CSS3 教程
CSS3 教程

共18课时 | 4.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号