0

0

大型模型开发工具集已经建立!

王林

王林

发布时间:2023-09-17 14:21:08

|

1280人浏览过

|

来源于51CTO.COM

转载

需要进行改写的内容是:作者 richard macmanus

策划 | 言征

Web3未能颠覆掉Web2,但新兴的大模型开发栈正在让开发者从“云原生”时代迈向新的AI技术栈。

提示工程师或许不能触动开发者奔赴大模型的神经,但产品经理或者领导的一句:能不能开发一个“agent”,能不能实现一条“chain”,“使用哪款向量数据库”,却成为了目前各大主流大模型应用公司中驱动技术同学攻克生成AI开发的难点所在。

新兴的技术栈究竟分为哪几层?哪里最为棘手?本文将带领大家一探究竟

1、技术栈需要更新了开发者迎来AI工程师时代

在过去的一年里,出现了一些工具,如LangChain和LlamaIndex,这使得AI应用程序的开发者生态系统开始变得成熟。甚至,现在还有一个术语来形容那些专注于人工智能开发的人员,即“AI工程师”。根据Shawn@swyx Wang的说法,这是“提示工程师”的下一步。他还创建了一张坐标图,形象地展示了AI工程师在更广泛的人工智能生态系统中的位置

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

大型模型开发工具集已经建立!图源:swyx

大型语言模型(LLM)是AI工程师的核心技术。LangChain和LlamaIndex都是扩展和补充LLM的工具,这绝非巧合。但是,对于这类新的开发人员来说,还有什么其他工具可用呢?

到目前为止,我看到的LLM堆栈的最佳图表来自风险投资公司Andreessen Horowitz(a16z)。以下是它对“LLM app stack”的看法:

大型模型开发工具集已经建立!图源:a16z

2、没错,最顶层的还是数据

在LLM技术栈中,数据是最重要的组成部分,这一点非常明显。根据a16z的图表,数据处于最顶层。在LLM中,"嵌入模型"是非常关键的领域,你可以从OpenAI、Cohere、Hugging Face或其他几十种LLM选项中进行选择,其中包括越来越受欢迎的开源LLM

在使用LLM之前,还需要建立一个“数据管道”。例如,可以将Databricks和Airflow作为两个示例,或者可以对数据进行“非结构化”处理。这对于数据的周期性也是适用的,可以帮助企业在将数据输入自定义LLM之前进行数据的“清理”或简单整理。像Alation这样的“数据智能”公司提供这种类型的服务,听起来有点像IT技术栈中更为人知的“商业智能”等工具

数据层的最后一部分是近期非常受欢迎的向量数据库,用于存储和处理LLM数据。根据微软的定义,这是一种将数据存储为高维向量的数据库,高维向量是特征或属性的数学表示。数据使用嵌入技术存储为向量

在一次媒体交谈中,领先的向量数据库供应商Pinecone指出,他们的工具经常与数据管道工具(如Databricks)一起使用。在这种情况下,数据通常存储在其他地方(比如数据湖),然后通过机器学习模型转换为嵌入式数据。经过处理和分块后,生成的向量会被发送到Pinecone

3、提示和查询

接下来的两个层次可以总结为提示和查询 - 这是人工智能应用程序与LLM和(可选)其他数据工具接口的交互点。A16z将LangChain和LlamaIndex定位为“编排框架”,这意味着一旦开发人员了解他们使用的是哪种LLM,就可以利用这些工具

极限网络办公Office Automation
极限网络办公Office Automation

专为中小型企业定制的网络办公软件,富有竞争力的十大特性: 1、独创 web服务器、数据库和应用程序全部自动傻瓜安装,建立企业信息中枢 只需3分钟。 2、客户机无需安装专用软件,使用浏览器即可实现全球办公。 3、集成Internet邮件管理组件,提供web方式的远程邮件服务。 4、集成语音会议组件,节省长途话费开支。 5、集成手机短信组件,重要信息可直接发送到员工手机。 6、集成网络硬

下载

根据a16z的观点,像LangChain和LlamaIndex这样的编排框架“抽象掉了许多提示链接的细节”,这意味着在应用程序和LLM之间查询和管理数据。这个编排过程包括与外部API接口的交互,从矢量数据库中检索上下文数据,以及在多个LLM调用中维护内存。a16z图表中最有趣的方框是“游乐场”,其中包括OpenAI、nat.dev和Humanloop

A16z在博客文章中没有确切定义,但我们可以推断,“游乐场”工具可以帮助开发人员施展A16z所说的“提示柔术”。在这些地方,开发人员可以尝试各种提示技术。

Humanloop是一家英国公司,其平台的一个功能是“协作提示工作区”。它进一步将自己描述为“用于生产LLM功能的完整开发工具包”。因此,基本上,它允许您尝试LLM的东西,然后将其部署到应用程序中(如果它有效的话)

4、流水线作业:LLMOps

目前,大型生产流水线的布局正在逐渐明确。在编排框的右侧,有许多操作框,其中包括LLM缓存和验证。此外,还有一系列与LLM相关的云服务和API服务,其中包括Hugging Face等开放的API存储库,以及OpenAI等专有的API提供商

这可能是我们在“云原生”时代习惯的开发人员技术栈中最相似的地方,许多DevOps公司将人工智能添加到了他们的产品列表中,这绝非巧合。5月,我与Harness首席执行官Jyoti Bansal进行了交谈。Harness运行一个“软件交付平台”,专注于CI/CD流程的“CD”部分。

Bansai告诉我,人工智能可以减轻软件交付生命周期中涉及的繁琐和重复的任务,从基于现有功能生成规范到编写代码。此外,他还表示,人工智能可以自动化代码审查、漏洞测试、错误修复,甚至为构建和部署创建CI/CD管道。根据我在五月份的另一次对话,人工智能也在改变开发人员的生产力。来自构建自动化工具Gradle的Trisha Gee告诉我,人工智能可以通过减少重复任务(如编写样板代码)的时间来加速开发,并使开发人员能够专注于大局,如确保代码满足业务需求。

5、Web3凉了,大模型开发栈来了

在新兴的LLM开发技术栈中,我们可以观察到一系列新的产品类型,例如编排框架(如LangChain和LlamaIndex)、向量数据库和Humanloop等“游乐场”平台。所有这些产品都在扩展和/或补充当前时代的核心技术:大型语言模型

一如前几年Spring Cloud、Kubernetes等云原生时代工具的兴起。只不过当下,几乎所有云原生时代的大、小、顶流企业都在极力将其工具适应AI工程化,这就会对LLM技术栈的未来发展非常有利。

没错,这一次的大模型俨然“站在巨人的肩膀上”,计算机技术中最好的创新总是建立在以前的基础上。也许这就是“Web3”革命失败的原因——与其说它是建立在上一代的基础上,不如说它试图篡夺它。

LLM技术栈似乎已经做到了,它成为了从云开发时代到更新的、基于人工智能的开发者生态系统的桥梁

参考链接:https://www.php.cn/link/c589c3a8f99401b24b9380e86d939842

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
spring框架介绍
spring框架介绍

本专题整合了spring框架相关内容,想了解更多详细内容,请阅读专题下面的文章。

142

2025.08.06

Java Spring Security 与认证授权
Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用,涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造(CSRF)防护、会话管理与安全漏洞防范。通过实际项目案例,帮助学习者掌握如何 使用 Spring Security 实现高安全性认证与授权机制,提升 Web 应用的安全性与用户数据保护。

81

2026.01.26

Java 微服务与 Spring Cloud 实战
Java 微服务与 Spring Cloud 实战

本专题讲解 Java 微服务架构的开发与实践,重点使用 Spring Cloud 实现服务注册与发现、负载均衡、熔断与限流、分布式配置管理、API Gateway 和消息队列。通过实际项目案例,帮助开发者理解 如何将传统单体应用拆分为高可用、可扩展的微服务架构,并有效管理和调度分布式系统中的各个组件。

45

2026.02.05

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1507

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

403

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2254

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

37

2026.01.19

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

419

2023.07.18

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

462

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.3万人学习

Django 教程
Django 教程

共28课时 | 4.3万人学习

React 教程
React 教程

共58课时 | 5.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号