0

0

什么是TII Falcon 180B开源语言模型?

PHPz

PHPz

发布时间:2023-09-12 19:41:09

|

1208人浏览过

|

来源于云东方

转载

技术创新研究所(tii)通过引入名为falcon的新大型语言模型(llm)为开源社区做出了重大贡献。该模型拥有令人印象深刻的 180 亿个参数,是一个生成式 llm,提供各种版本,包括 falcon 180b、40b、7.5b 和 1.3b 参数 ai 模型。

当猎鹰40B推出时,它迅速获得了世界顶级开源AI模型的认可。这个版本的猎鹰,有40亿个参数,是在惊人的一万亿个代币上训练的。在推出后的两个月里,猎鹰40B在Hugging Face的开源大型语言模型(LLM)排行榜上一直位居榜首。Falcon 40B的与众不同之处在于,它完全免版税,重量是革命性的举措,有助于使AI民主化并使其成为更具包容性的技术。

猎鹰40B LLM是多语言的,适用于多种语言,包括英语,德语,西班牙语,法语,意大利语,葡萄牙语,波兰语,荷兰语,罗马尼亚语,捷克语和瑞典语。这个基础LLM作为一个通用的基本模型,可以微调以满足特定的要求或目标。

猎鹰180B开源法学硕士

Falcon 180B是具有180亿个参数的超强大语言模型,经过了3.5万亿个代币的训练。它目前在预训练的开放大型语言模型的拥抱脸排行榜上名列前茅,可用于研究和商业用途。该模型在推理、编码、熟练程度和知识测试等各种任务中表现出色,甚至优于 Meta 的 LLaMA 2 等竞争对手。

在闭源模型中,Falcon 180B仅次于OpenAI的GPT 4,性能与Google的PaLM 2相当,后者为Bard提供动力,尽管其尺寸仅为模型的一半。这证明了模型的质量,因为LLM对他们训练的数据特别敏感。TII 团队构建了一个自定义数据管道,使用广泛的过滤和重复数据删除来提取高质量的预训练数据,并在样本级别和字符串级别实施。

Kacha
Kacha

KaCha是一款革命性的AI写真工具,用AI技术将照片变成杰作!

下载

为了鼓励该模型的创新使用,猎鹰40B发起了科学家、研究人员和创新者的“提案征集”。最特殊的用例将获得训练计算能力的投资,以研究强大的模型来塑造变革性的解决方案。值得注意的是,该模型仅使用了 GPT-75 训练计算的 3%,龙猫 AI 的 40% 和 PaLM-80B 的 62%。

猎鹰开发的显着因素之一是训练数据的质量。为Falcon 40B收集的预训练数据是近80万亿个代币,从各种来源收集,包括公共网络爬虫(~%),研究论文,法律文本,新闻,文学和社交媒体对话。

在 3.5 万亿个代币上接受培训

Falcon模型的训练过程涉及同时使用4096个GPU,每小时总计约7万个GPU。Falcon的培训数据集由网络数据组成,并辅以一系列精选内容,包括对话、技术论文、维基百科和一小部分代码。该模型已针对各种对话和教学数据集进行了微调,但不包括托管使用。

尽管性能令人印象深刻,但猎鹰模型没有关于最近事件的最新信息。然而,猎鹰模型的发布被视为开源领域的重大进步,在各种基准测试上优于其他模型,如Llama 2,Stable LM,Red Pajama,NPT等。该模型比Llama 2大5.2倍,在各种基准测试中优于Llama 2,OpenAI的GPT 3.5模型和Google的Palm。这使其成为研究和商业用途的强大工具,也是对开源社区的重大贡献。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1566

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

649

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1228

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1184

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

192

2025.07.29

c++字符串相关教程
c++字符串相关教程

本专题整合了c++字符串相关教程,阅读专题下面的文章了解更多详细内容。

131

2025.08.07

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 4.9万人学习

Go 教程
Go 教程

共32课时 | 6.1万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号