0

0

FireRedASR2S— 小红书开源的语音识别模型

霞舞

霞舞

发布时间:2026-02-26 12:13:06

|

493人浏览过

|

来源于php中文网

原创

fireredasr2s是什么

fireredasr2s是由小红书super intelligence-audiolab推出的工业级端到端语音识别系统,由audiolab开源。该模型深度融合了语音识别(asr)、语音活动检测(vad)、语种识别(lid)与标点预测(punc)四大前沿模块,全部达到当前开源领域领先水平(sota)。支持中文普通话、20余种方言、英语、中英混合、代码语音及歌词识别等复杂场景;其中普通话字错率低至2.89%,方言平均字错率为11.55%,性能全面超越doubao-asr、qwen3-asr等同类模型。系统提供开箱即用的一键本地部署方案,无需依赖任何外部api服务,目前已在小红书语音评论、语音搜索等高并发真实业务场景中实现大规模落地应用。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

FireRedASR2S— 小红书开源的语音识别模型

WOMBO
WOMBO

使用AI创作美丽的艺术品

下载

FireRedASR2S的核心能力

  • 语音识别(FireRedASR2):覆盖中文普通话、20+地方口音与方言、英语、中英文混说、编程语音及歌曲演唱识别;提供LLM驱动与AED(Attention-based Encoder-Decoder)双架构版本,AED版额外支持逐字级时间戳与置信度输出。
  • 语音活动检测(FireRedVAD):可精准区分语音、人声演唱与背景音乐,兼容100余种语言输入;支持流式与非流式两种推理模式,F1指标达97.57%。
  • 语种识别(FireRedLID):支持100+国际语言及20+中文方言判别,整体准确率达97.18%,显著优于Whisper等主流开源模型。
  • 标点预测(FireRedPunc):自动为无标点转录文本添加中英文标点符号,综合F1分数为78.90%,显著提升文本自然度与阅读体验。

FireRedASR2S的技术实现

  • 语音识别(FireRedASR2):采用Encoder-Adapter-LLM与Attention-based Encoder-Decoder双路径设计。LLM版本借助大语言模型强大的语义理解能力实现语音到文本的深层映射;AED版本则在经典编解码结构基础上引入轻量适配器层,高效融合声学与语言特征,兼顾精度与实时性,并原生支持字级对齐与置信度估计。
  • 语音活动检测(FireRedVAD):基于DFSMN(Deep Feedforward Sequential Memory Networks)构建时序建模主干,结合滑动窗口平滑策略与动态阈值机制,精准定位语音起止边界,同时区分说话声、歌声与伴奏音乐,满足低延迟流式处理需求。
  • 语种识别(FireRedLID):复用FireRedASR2共享编码器提取通用语音表征,接轻量分类头完成语种/方言判别;依托海量多语种预训练数据,构建跨语言统一语义空间,保障多语种泛化能力与细粒度方言区分效果。
  • 标点预测(FireRedPunc):以BERT为基础架构,将原始ASR输出文本作为输入序列,对每个token位置预测对应标点类别(句号、逗号、问号等);经中英文多领域语料联合微调,深度学习上下文语义与句法结构规律,实现高质量标点还原。

FireRedASR2S的官方资源

FireRedASR2S的典型应用场景

  • 内容社区交互升级:已在小红书平台支撑语音评论、语音搜索等高频功能,使用户能以方言、唱歌、快板等形式自由表达,强化社区“真人感”与互动趣味性。
  • 社交沟通体验优化:赋能语音私信、节日语音祝福等场景,实现边说边转、所听即所得的实时语音输入体验,降低表达门槛,增强情感传达效率。
  • 多媒体内容生产提效:支持语音发布笔记、直播实时字幕、短视频自动生成字幕等功能,助力创作者快速完成音视频内容加工与传播。
  • 企业级智能服务支撑:适用于会议纪要生成、智能语音客服、通话质量分析等B端业务,支持完全私有化部署,满足金融、政务、医疗等行业对数据主权与合规性的严苛要求。

相关文章

小红书
小红书

小红书是一款集种草分享、生活购物、社交于一体的综合app。小红书汇集了时尚、美容、生活方式、旅行、美食等多个领域的内容,为用户提供了丰富多彩的体验和无限灵感,有需要的小伙伴快来保存下载体验吧!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
batoto漫画官网入口与网页版访问指南
batoto漫画官网入口与网页版访问指南

本专题系统整理batoto漫画官方网站最新可用入口,涵盖最新官网地址、网页版登录页面及防走失访问方式说明,帮助用户快速找到batoto漫画官方平台,稳定在线阅读各类漫画内容。

331

2026.02.25

Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法
Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法

本专题系统整理Steam官网最新可用入口,涵盖网页版登录地址、新用户注册流程、账号登录方法及官方游戏商店访问说明,帮助新手玩家快速进入Steam平台,完成注册登录并管理个人游戏库。

49

2026.02.25

TypeScript全栈项目架构与接口规范设计
TypeScript全栈项目架构与接口规范设计

本专题面向全栈开发者,系统讲解基于 TypeScript 构建前后端统一技术栈的工程化实践。内容涵盖项目分层设计、接口协议规范、类型共享机制、错误码体系设计、接口自动化生成与文档维护方案。通过完整项目示例,帮助开发者构建结构清晰、类型安全、易维护的现代全栈应用架构。

33

2026.02.25

Python数据处理流水线与ETL工程实战
Python数据处理流水线与ETL工程实战

本专题聚焦 Python 在数据工程场景下的实际应用,系统讲解 ETL 流程设计、数据抽取与清洗、批处理与增量处理方案,以及数据质量校验与异常处理机制。通过构建完整的数据处理流水线案例,帮助开发者掌握数据工程中的性能优化思路与工程化规范,为后续数据分析与机器学习提供稳定可靠的数据基础。

13

2026.02.25

Java领域驱动设计(DDD)与复杂业务建模实战
Java领域驱动设计(DDD)与复杂业务建模实战

本专题围绕 Java 在复杂业务系统中的建模与架构设计展开,深入讲解领域驱动设计(DDD)的核心思想与落地实践。内容涵盖领域划分、聚合根设计、限界上下文、领域事件、贫血模型与充血模型对比,并结合实际业务案例,讲解如何在 Spring 体系中实现可演进的领域模型架构,帮助开发者应对复杂业务带来的系统演化挑战。

5

2026.02.25

Golang 生态工具与框架:扩展开发能力
Golang 生态工具与框架:扩展开发能力

《Golang 生态工具与框架》系统梳理 Go 语言在实际工程中的主流工具链与框架选型思路,涵盖 Web 框架、RPC 通信、依赖管理、测试工具、代码生成与项目结构设计等内容。通过真实项目场景解析不同工具的适用边界与组合方式,帮助开发者构建高效、可维护的 Go 工程体系,并提升团队协作与交付效率。

19

2026.02.24

Golang 性能优化专题:提升应用效率
Golang 性能优化专题:提升应用效率

《Golang 性能优化专题》聚焦 Go 应用在高并发与大规模服务中的性能问题,从 profiling、内存分配、Goroutine 调度、GC 机制到 I/O 与锁竞争逐层分析。结合真实案例讲解定位瓶颈的方法与优化策略,帮助开发者建立系统化性能调优思维,在保证代码可维护性的同时显著提升服务吞吐与稳定性。

9

2026.02.24

Golang 面试题精选:高频问题与解答
Golang 面试题精选:高频问题与解答

Golang 面试题精选》系统整理企业常见 Go 技术面试问题,覆盖语言基础、并发模型、内存与调度机制、网络编程、工程实践与性能优化等核心知识点。每道题不仅给出答案,还拆解背后的设计原理与考察思路,帮助读者建立完整知识结构,在面试与实际开发中都能更从容应对复杂问题。

7

2026.02.24

Golang 运行与部署实战:从本地到云端
Golang 运行与部署实战:从本地到云端

《Golang 运行与部署实战》围绕 Go 应用从开发完成到稳定上线的完整流程展开,系统讲解编译构建、环境配置、日志与配置管理、容器化部署以及常见运维问题处理。结合真实项目场景,拆解自动化构建与持续部署思路,帮助开发者建立可靠的发布流程,提升服务稳定性与可维护性。

5

2026.02.24

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
送外卖还是学编程?
送外卖还是学编程?

共7课时 | 0.5万人学习

前端工程师必备技能—PS切图
前端工程师必备技能—PS切图

共11课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号