0

0

快手提出亿级别多模态短视频百科体系——快知(Kuaipedia)

王林

王林

发布时间:2023-05-20 17:10:08

|

2593人浏览过

|

来源于51CTO.COM

转载

引言

当前,越来越多的短视频用户不仅希望利用碎片化的时间来休闲娱乐,也开始希望能够在短视频平台中获取更多知识。2021年,快手泛知识内容播放量同比增长58.11%,平台全年有超过3300万场泛知识直播 [1]。为了更好地理解和组织泛知识视频,快手MMU联合哈尔滨工业大学等提出业界首个多模态短视频百科——“快知(Kuaipedia)”:通过多模态和知识图谱技术从海量短视频中挖掘大规模高质量的知识视频,并将其结构化,形成体系化的短视频百科知识库,为用户提供更好的知识获取体验,同时激发创作者创造优质知识内容,构建良性的知识分享生态。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

快手提出亿级别多模态短视频百科体系——快知(Kuaipedia)

论文链接:https://www.php.cn/link/b0da9d8dd88178e3bb138e08742eb2e2

项目主页:https://www.php.cn/link/1a725948eb0c738707b5c026a65ba618

团队从快手海量短视频中挖掘出亿级别知识类视频,并对其进行了结构化,构建了千万级词条和知识点视频百科体系。“快知(Kuaipedia)”的提出有助于学界推动AI通过多模态信息理解世界知识,且在产业界落地有较大想象空间。

快手提出亿级别多模态短视频百科体系——快知(Kuaipedia)

介绍

百科全书(Encyclopedia),可以追溯到希腊和罗马,也是17-18世纪法国启蒙运动的一个杰出的成果。知识百科通常是指一个是概要介绍人类全部知识或某一特定领域或学科的工具书或纲要,在互联网急速发展的当下,网络百科成为知识新的载体,如维基百科、百度百科等。但这些百科通常以图文、表格为载体,比较难以表达一些需要生动演示的知识,比如教程(How-to)类知识。图一展示了使用图文讲述 “柴犬”-“怎么画” 这一知识的困境。而通过短视频,我们能够很好地对这些知识进行一个阐释和学习。

具体视频见https://www.php.cn/link/70e9dbe24ba303f2d25ac34d3ae945c5

快手提出亿级别多模态短视频百科体系——快知(Kuaipedia)

图一:图文在how-to类知识上知识传递的困境,图文来自短视频的帧截图

随着内容行业和媒体形态的不断迭代,短视频已经越来越成为知识传播者的主要媒介,尤其是在一些技能和特长类的知识传播,天然就有它的一些优势。而在当下,尽管有公开的网络百科中有视频的内容,但通常是偏简介形式(如秒懂百科),没有将短视频最大程度的进行利用,因此短视频在知识百科中的表达能力被严重低估。比如当人们讲到“柴犬”,人们除了“简介” 以外,还关注“怎么挑”、“怎么梳毛”、“怎么纠正护食”等。因此我们认为将知识类的短视频结构化,构成结构化的短视频百科是一条理解世界知识、帮助人类以更高效率传播知识的有效途径。

参考国家标准科普知识,技能(How)类归结为教程知识,在快手海量的视频中挖掘出高质的知识视频。此外,我们将短视频中抽取的知识主体以词条形式呈现(如柴犬),并抽取视频中讲解的该词条具体的知识点(如柴犬-挑选、柴犬-护食纠正等),最终构成了一个短视频的百科知识体系,如图二所示。

快手提出亿级别多模态短视频百科体系——快知(Kuaipedia)

图二:快知——多模态短视频百科概览

“快知(Kuaipedia)”的提出有以下几个贡献:

“快知”的定义:我们开创性地定义了一个全新的多模态知识百科库,以词条、知识点、知识类短视频以及它们间的关系共同构成。这是业界首个结构化的多模态短视频百科。

构建大规模短视频百科的方法:我们提出使用知识视频识别、词条知识点挖掘、多模态知识链接的组合来构建大规模的短视频百科。并开创性提出“多模态知识链接”任务,作为传统实体链接的一个外延和扩展。

富有潜力和想象空间的应用:在学术上,“快知”以崭新的知识点短视频化组织形式,能够突破目前机器仅靠图文知识图谱(KG)理解世界知识的上限,在KG的一些下游任务如实体链接、实体分类,或者NLP、CV等内容理解下游任务上,有非常大的潜力。在产业界,“快知”这样的形式能够助力短视频平台进行高效地运营、组织内容,提升用户对知识的理解与消费效率。

技术概览

为了实现上述的短视频百科结构化,核心技术包括以下三个主要步骤,如图三所示。

知识视频识别:通过多模态视频预训练模型,理解并识别海量视频中知识类视频;

词条和知识点挖掘:通过多源知识库融合“自顶向下”构建词条体系,再通过对用户搜索query挖掘“自底向上”构建词条与知识点关系,形成词条知识点树

多模态知识链接:创新性地扩展传统“实体链接”任务,提出通过多模态内容理解技术将视频链接到词条(如柴犬)的某一个知识点(如护食纠正)上的“多模态知识链接”任务。

快手提出亿级别多模态短视频百科体系——快知(Kuaipedia)

图三:快知构建技术链路

通过大量详实的人工评测,快知所挖掘的知识点与视频已具备较高的准确率和质量。更详细的算法和实验数据具体参见论文或者我们的Github主页(见文章开头)。

应用

首先,“快知(Kuaipedia)”这样的多模态短视频百科体系,在学术界对于推动AI理解世界知识的技术发展有极大的潜力。一方面,“快知”突破图文和表格的局限,通过更丰富的知识点和短视频来描述某一个实体或者概念,这种方式能够推动多模态知识图谱技术的发展。另一方面,这些知识点和短视频有助于AI更好地理解世界知识,尤其是一些图文难表述的 How-to 类知识,这种多模态知识能够增强AI对世界的理解,对KG、NLP、CV等领域的下游应用都很有帮助。我们在CCKS实体链指的任务上,证明“快知”多模态知识的简单引入就能有效提升BERT在实体链接和在实体分类上的性能。

此外,“快知”在产业落地极具想象力,在短视频生态向“泛知识”拓展的过程中,现有的形式约束了其传播方式,“快知”通过结构化的内容,能提升平台的运营和分发效率,更好地满足用户的求知诉求。我们将该项技术首先在健康垂类进行了落地尝试,快手健康团队此前以病种为组织维度,纯人工挖掘了一批优质PUGC内容,但是存在疾病知识体系不完善、权威性知识视频量级小等痛点,难以高效率构建完整、大规模、结构化的疾病视频体系。利用“快知”的技术后,自动化地挖掘出了一批高质量、有快手特色的知识点和知识视频,丰富了疾病类内容,比纯人工构建提效几十倍。目前这批内容已经在快手App精选页上线:点击精选视频流中某个疾病类视频的「底部通栏」,唤起「快手健康」半屏页,用户可以消费该视频所属词条下的相关知识点和相关知识视频,如图四所示。

快手提出亿级别多模态短视频百科体系——快知(Kuaipedia)

图四:快知在健康场景落地

除健康外,“快知”还覆盖了教育、美食、三农、亲子、法律、科技、金融等众多领域的知识内容,有着较大的应用潜力。

结语

面对泛知识类内容在短视频行业的发展前景,我们提出了“快知(Kuaipedia)”多模态短视频百科体系,从存量的海量短视频内容入手,通过多模态知识图谱构建技术挖掘出亿级别高质量的知识视频,并将知识内容结构化,构建业界首个大规模体系化的短视频百科知识库,其在学术界和产业界有较大的潜力和想象空间。

作者介绍

第一作者:潘浩杰

Insou AI
Insou AI

Insou AI 是一款强大的人工智能助手,旨在帮助你轻松创建引人入胜的内容和令人印象深刻的演示。

下载

快手MMU知识图谱中心成员,快知项目负责人,本硕毕业于浙大和港科大,曾在阿里云PAI负责大规模NLP算法与框架,在ACL、EMNLP、KDD、AIJ等顶会顶刊中发表10余篇论文,多项国内和美国专利,详见知乎。2021年加入快手。


通讯作者:付瑞吉

快手MMU知识图谱中心负责人,本硕博毕业于哈工大,中科大博士后。曾担任科大讯飞AI研究院副院长,获吴文俊人工智能科技进步奖一等奖。在ACL、EMNLP、Coling、IJCAI、TASLP等国际会议和期刊上发表学术论文多篇,申请(获得)国家发明专利四十余项。2021年加入快手。

合作老师:刘铭

教授/博士生生导师,哈尔滨工业大学计算学部。先后主持国家重点研发计划项目课题、国家自然科学基金、中国博士后科学基金特别资助、中国博士后科学基金面上资助一等资助、黑龙江省面上基金等多项基金项目。获黑龙江省科学技术一等奖,哈尔滨市科技成果,第六届全国青年人工智能创新创业大会一等奖。 近年来以第一作者或通讯作者发表CCFA/B类论文20余篇,参编教材一部,英文译著一部。担任NLPCC2020、CCKS2020、COLING2022知识图谱领域主席,CCKS2019出版主席、CCKS2021评测主席、CCKS2022讲习班主席。

参考文献

[1] 快手,2022快手泛知识内容生态报告.

[2] 国家标准委:知识管理框架,GB/T 23703.

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

89

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

173

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号