0

0

硅谷人工智能公司NexaAI发布端侧AI部署新思路

雪夜

雪夜

发布时间:2025-12-16 19:15:29

|

111人浏览过

|

来源于php中文网

原创

2025年,是ai硬件的全面爆发之年:ai手机、aipc、ai陪伴、ai眼镜、ai智慧座舱……然而,云端大模型主导的ai硬件正在显露隐忧:高昂的api调用成本让中小企业望而却步,隐私数据上传云端的安全风险如影随形,网络延迟与垂域适配不足更是制约着端侧的场景创新

开源端侧小模型崛起正在改写游戏规则:英伟达也在论文《SmallLanguage Models are the Future of Agentic AI》宣告:小模型才是AgenticAI的未来。

1.部署难、表现差?端侧AI发展仍面临痛点

当开发者们摩拳擦掌,想要用先进小模型打造创新应用时,现实又浇了一盆冷水:

部署门槛高:端侧平台的推理框架并不像云端那样容易适配:工具链有CUDA、QNN、ANE、ROCm、Openvino,openCL, metal, vulkan等等五花八门……耗费数月踩坑仍难跑通最新模型;

性能表现差:即使顺利通过部署,由于推理引擎适配不当导致精度下降、输出缓慢、能耗飙升,让端侧应用体验大打折扣

跨平台噩梦:不同硬件(PC,手机,车机,IoT)、心片(高通、Intel、AMD、苹果)间的适配壁垒,让跨设备应用开发重复“踩坑”,效率极低。例如可以在高通PC上运行的多模态模型无法自动移植到高通车载端。

最新的模型支持差:NPU上普遍只能跑1年以前发布的模型,无法使用最新的模型(如Mistral3,Qwen3-VL),模型需要等待非常久的时间才能得到支持。

2.端侧AI部署的新思路

最近美国硅谷明星端侧AIStartup Nexa AI公司在github上发布的NexaSDK,为全球开发者带来了破局新思路。这个项目致力于解决长期存在于端侧模型部署中的共性问题,让AI模型在手机、PC、汽车、IoT等边缘设备上的落地变得前所未有的简单。

github可搜索:nexa-sdk(如果认为对您工作有帮助,欢迎为开源作者star)

NexaSDK 构建了4大核心优势,解决端侧AI部署的核心痛点:

跨平台统一推理框架:NexaSDK由NexaML引擎提供支持,该引擎是从心片Kernel层打造的跨硬件平台统一推理引擎(支持电脑,手机,车,IoT,机器人,以及AR眼镜等设备),并支持三种端侧模型格式:GGUF格式、MLX格式以及NexaAI 自主研发的.nexa格式。

NPU,GPU, CPU深度适配:NexaSDK可在多种算力平台的NPU、GPU、CPU上本地运行各类人工智能模型—— 它不仅使用简单、灵活性高,而且性能佳。特别是支持各大算力平台的NPU心片(覆盖高通HexagonNPU, 苹果NPU,AMDRyzen AI NPU,以及IntelNPU),充分利用NPU性能,可以解决过往端侧模型在CPU/GPU上运行带来的输出速度慢、能耗高的问题,能效比是CPU和GPU的9倍以上。

硅谷人工智能公司NexaAI发布端侧AI部署新思路

任意多模态模型Day-0支持:面对快速更新的开源模型市场,NexaSDK能够做到在新模型推出的第一时间适配各个硬件后端(NPU,GPU, CPU),并且支持多种模态Vision,Text, Audio, 以及CV模型;

低代码极致易用:使用一行代码即可调用本地模型,OpenAIAPI 兼容设计让开发者无缝衔接代码,大大降低了端侧AI的应用门槛。

NexaSDK与其他端侧SDK的比较优势:

硅谷人工智能公司NexaAI发布端侧AI部署新思路

NEXASDK一经发布也获得了包括AMD/高通的诸多行业认可:

硅谷人工智能公司NexaAI发布端侧AI部署新思路

3.快速上手:快速解锁端侧AI能力

根据使用方式和平台,NexaSDK提供不同的工具包:

NexaCLI:可在MacOS/Windows/Linux使用命令行终端速测试模型及运行本地服务器;同时支持在Linux系统的容器化环境中运行AI模型;

NexaSDK Python开发工具:可在MacOS/Windows/Linux平台使用Python完整运行SDK

NexaSDK Android/iOS开发工具:支持在移动端设备跨NPU/GPU/CPU推理的安卓/iOS开发工具包

NexaSDK实现了全平台支持,全球首次统一支持苹果NPU、IntelNPU、AMDNPU、高通NPU等4类NPU推理加速心片,让端侧模型边缘推理拥有了更广泛的实现和应用场景。

3.1Nexa SDK CLI快速体验

下载路径:

可以从NexaAI官网或者githubnexa-sdk项目下载NexaCLI。

硅谷人工智能公司NexaAI发布端侧AI部署新思路

一行代码运行模型

NexaSDK支持LLM、多模态、音频(ASR\TTS)、CV、生图等多种端侧模型。例如:

多模态模型

NexaSDK在Qwen3VL发布当天 Day-0跨平台支持,领先 llama.cpp/ollama 三周,并得到Qwen官方认可

硅谷人工智能公司NexaAI发布端侧AI部署新思路

车载多模态模型(适配高通SA8295P心片NPU)

硅谷人工智能公司NexaAI发布端侧AI部署新思路

相比于其他框架,NexaSDK对于新模型的支持速度还是非常迅速,可以访问NexaAI官网和NexaAI huggingface官方模型仓库查看使用更多精选的模型。

硅谷人工智能公司NexaAI发布端侧AI部署新思路

目前NexaCLI支持MacOS、Windows、Linux(并支持Docker运行),同时提供PythonAPI, IOS Swift API、AndroidKotlin/JAVA API开发工具包。

Cursor
Cursor

一个新的IDE,使用AI来帮助您重构、理解、调试和编写代码。

下载

兼容OpenAIAPI

NEXACLI还提供OpenAI兼容的RESTAPI ,一行命令即可访问服务接口,无缝覆盖对话生成、文本嵌入、文档重排序、图像生成等核心场景,满足多样化开发需求。

硅谷人工智能公司NexaAI发布端侧AI部署新思路

/v1/chat/completions- 用于LLM和VLM的对话生成

/v1/embeddings- 为文本生成向量嵌入

/v1/reranking- 根据查询相关性对文档重新排序

/v1/images/generations- 根据提示生成图像

更多命令可以查看官方文档

3.2Nexa SDK Python 开发工具包

NexaSDK Python工具包,适配MacOS、Windows、Linux等全平台优化后端,无论是本地开发还是企业级应用,都能使用Python更高效落地。可以使用PythonAPI一键运行LLM、VLM、OCR、ASR、TTS、图像生成、说话人分离、键值缓存、采样配置、对话模板以及错误处理等。

硅谷人工智能公司NexaAI发布端侧AI部署新思路

3.3Nexa SDK Android/iOS开发工具包

下载地址:

NexaSDK Android工具包:可直接从Maven中央仓库获取,或访问githubnexa-sdk项目

硅谷人工智能公司NexaAI发布端侧AI部署新思路

NexaSDK iOS工具包可以从githubnexasdk-mobile-iOS-framework项目获取。

Android设备上支持直接运行的包括LLM、VLM、Embedding模型、OCR模型、CV模型、ASR模型、rerank模型以及生图模型,且支持通过NPU、GPU和CPU进行推理。通过Kotlin/JavaAPI 轻松集成,性能提升2倍,能效比优化9倍,重塑移动智能体验。

使用简洁的SwiftAPI,开发者可在iOS/macOS设备上直接运行LLM、VLM、Embedding模型、ASR模型以及rerank模型。目前,ASR模型与Embedding模型已支持苹果神经网络引擎(ANE)加速,其他模型则基于图形处理器(GPU)与中央处理器(CPU)运行,同时可以达到性能提升2倍,能效比优化9倍的惊艳体验。

硅谷人工智能公司NexaAI发布端侧AI部署新思路

4.为开发者带来丝滑体验:创意无需妥协

一行命令跑通:nexainfer 极简操作,告别复杂配置;

OpenAIAPI 无缝兼容:现有代码零修改,直接迁移端侧运行;

95%NPU 利用率:性能优于QualcommGENIE,极致发挥硬件潜力;

首发支持前沿模型:Qwen3、Granite、Liquid、Gemma3n、Parakeet等最新模型快速适配;

结构化输出:天然适配 AIAgent 工作流,加速应用创新;

持续更新的前沿端侧模型库:NexaModel Hub不断扩充,让最先进端侧小模型触手可及。

5.结束语:从个人到产业—— 端侧AI想象力不再设限

当部署不再是难题,当性能不再妥协,端侧AI的革命,正在每一个场景悄然发生:

手机:离线助手,日程提醒、生活助理……

PC:文件管理、个人知识库构建、Agent协作……

汽车:车内AI助手,实时路况提醒,安全监测……

IoT& 机器人:工厂巡检、缺陷检测……

端侧AI的低成本、高隐私、低延迟特性,正在重构产品形态,催生全新商业模式。

希望今天分享的NexaSDK能让每一位热爱端侧AI的人都能参与到端侧AI的浪潮中,无需复杂的工具链,消解沉重的技术壁垒,赋能每一位开发者,解锁端侧AI落地的无限可能!

github项目:nexa-sdk(如果认为对您工作有帮助,欢迎为开源作者star)

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Java Maven专题
Java Maven专题

本专题聚焦 Java 主流构建工具 Maven 的学习与应用,系统讲解项目结构、依赖管理、插件使用、生命周期与多模块项目配置。通过企业管理系统、Web 应用与微服务项目实战,帮助学员全面掌握 Maven 在 Java 项目构建与团队协作中的核心技能。

0

2025.09.15

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1155

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

215

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1965

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

22

2026.01.19

github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

1074

2026.01.21

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

810

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1129

2023.07.27

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
帝国CMS企业仿站教程
帝国CMS企业仿站教程

共17课时 | 1.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号