0

0

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

PHPz

PHPz

发布时间:2024-07-16 16:23:14

|

389人浏览过

|

来源于IT之家

转载

无需任何修改转换,amd 显卡也跑起原版 cuda 程序了!

英国一家初创公司,推出了针对 AMD 的 CUDA 程序编译工具,而且免费商用。

工具一经发布就引发了网友们的广泛热议,并登顶了 HackerNews 热榜。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

该工具名为 SCALE,开发者给它的定位是一个 GPGPU(通用 GPU)编程工具包。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

目前已有大模型框架 llama-cpp 等 9 个程序通过测试,实现了正常运行。

与其他实现方式不同,SCALE 直接模拟 CUDA 工具包的安装,不需要转换成其他语言就能源到源地完成编译。

因此,像内联 PTX 这种英伟达专用的中间语言,SCALE 同样能够提供支持。

无需转换,让 AMD 跑起 CUDA

官网介绍显示,SCALE 主要有三个组成部分 —— 兼容的 nvcc 编译器、CUDA 运行时和驱动 API 的 AMD 实现,以及 ROCm 库。

其中编译器可以把用包括 nvcc、内联 PTX 等在内的 CUDA 专属语言编写的程序,直接编译成可在 AMD GPU 上运行的二进制代码。

ROCm 库则用来提供“CUDA-X”API,SCALE 在处理 cuBLAS 和 cuSOLVER 等库时均采用这种方式。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

SCALE 的关键创新点在于按原样接受 CUDA 程序,而不必将它们移植到另一种语言,兼容 nvcc 和 clang 等多种编译方式,同时现有的构建工具和脚本(如 cmake)可以正常工作。

按照官方的说法,SCALE 实现了对 CUDA 的完全兼容,让开发者无需针对不同 GPU 平台分别编写代码。

这一点与 AMD 推出的 HIP 存在很大不同,因为 HIP 是通过一定方式对 CUDA 代码进行重写,遇到复杂的宏可能无法正确理解,也不支持内联 PTX 等专属语言。

甚至 SCALE 作者认为,HIP 并不能解决 CUDA 兼容性问题。

另外,SCALE 的语言是 CUDA 的超集,提供一些可选的语言扩展,可以使希望摆脱 nvcc 的开发者更轻松、更高效地编写 GPU 代码。

作者表示,希望未来开发者可以只编写一次代码,就能不同硬件平台上运行,并正在着手通过弥合流行的 CUDA 编程语言和其他硬件供应商之间的兼容性差距。

目前,SCALE 对 AMD 各系列 GPU 的支持情况如下:

已支持:gfx1030(RX6000 系列)和 gfx1100(RX7000 系列)

“似乎有效”(seem to work):gfx1010(RX5000 系列)和 gfx1101

正在适配:gfx900(RX Vega 系列)

另外,作者测试了一些 CUDA 开源项目,并利用 SCALE 成功运行了 9 款 CUDA 应用。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

不过,SCALE 毕竟是个全新的项目,所以作者也准备了从安装到编译的一系列教程,给出了不同类型的示例程序。

教程关键步骤都附有相关代码,甚至包括了如何判断自己 GPU 的型号,可以说是非常细致了。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

如果使用过程中遇到问题,作者也介绍了常见故障的排除方式,同时还开通了 Discord 论坛,可与开发团队直接沟通交流。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

Type
Type

生成草稿,转换文本,获得写作帮助-等等。

下载

打造出 SCALE 的这家初创公司名为 Spectral Compute,2018 年成立于英国,自称对 CPU 和 GPU 的架构有深入的了解,目标是帮助开发者高效利用算力资源。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

网友:挑战英伟达护城河?

有网友认为,如果 SCALE 真能有(宣传中的)效果,那么将对英伟达护城河发起挑战,让 AMD 与之展开直接竞争。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

不过,现在下定论未免为时过早,毕竟 SCALE 官方也承认目前和原版 CUDA 相比还存在一些缺陷。

而且开发者也明确表示有一些 CUDA API 和功能并不被支持,但也没有给出具体的列表。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

关于“AMD 方案”的更多不足,一名自称和 SCALE 团队交流过的网友表示,目前的 SCALE 还无法操作 TensorCore,也就意味着 AMD 上跑不了 FlashAttention 加速框架。

另外由于 N 卡上有强大的矩阵乘法单元,所以即使能编译运行,AMD 卡上的性能可能也不及 N 卡。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

更有网友认为,英伟达一家独大的原因是 AMD 不愿意投资让其 GPU 拥有更高的机器学习性能(而不只是拥有 CUDA 这一个优势)。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

即便能够高效运行,AMD 卡是否真的经济实惠且容易获得,同样是一个问题。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

还有一波网友的观点是,最大的问题不是技术上能不能运行,而是背后的法律问题。

这个问题同样引发了广泛的讨论,不过目前也暂未有定论。

有人认为 SCALE 像 ZLUDA(另一种在 AMD 上运行 CUDA 程序的方式)一样存在法律疑点,有可能招致英伟达的诉讼。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

具体来说,根据英伟达的 EULA 条款,CUDA SDK 只允许开发在 N 卡上运行的应用程序,这可能禁止了类似 SCALE 这样的兼容实现。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

但立马就又有网友说,SCALE 并没有用到英伟达的“SDK”,何谈 SDK 使用协议呢?

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

总之,无论是技术不足还是法律问题,对于这个新工具的讨论都还在持续进行。

至于到底好不好用,这就要由开发者用脚投票了。

参考链接:

[1]https://docs.scale-lang.com/

[2]https://news.ycombinator.com/item?id=40970560

本文来自微信公众号:量子位(ID:QbitAI),作者:克雷西

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2092

2024.08.16

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

2

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

2

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

0

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

0

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

3

2026.01.29

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

25

2026.01.29

clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址
clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址

clawdbot龙虾机器人官网入口:https://clawd.bot/,clawdbot ai是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

16

2026.01.29

Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

8

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
正则表达式手册
正则表达式手册

共7课时 | 6.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号