Python如何实现视频关键帧提取？FFmpeg集成

星夢妙者

发布时间：2025-08-13 15:01:01

731人浏览过

来源于php中文网

原创

安装ffmpeg并配置环境变量，2. 使用pip安装ffmpeg-python和opencv-python库，3. 编写python代码调用ffmpeg读取视频帧并结合opencv计算帧间差异，通过设定threshold阈值提取关键帧，4. 调整threshold参数可控制关键帧提取数量，值越大提取越少，5. 其他方法包括基于聚类、镜头分割和深度学习的技术，其中深度学习效果最好但计算开销大，6. ffmpeg是音视频处理基石，提供强大的格式支持和编解码能力，使python能高效完成关键帧提取等任务。

Python如何实现视频关键帧提取？FFmpeg集成

视频关键帧提取，说白了，就是找出视频里最具代表性的几帧画面，让你快速了解视频的大致内容，省去完整观看的时间。Python结合FFmpeg，就能轻松搞定这件事。

直接上解决方案：

安装FFmpeg： 这是个强大的音视频处理工具，Python只是调用它。去FFmpeg官网下载安装，然后把它的bin目录加到系统环境变量里。

立即学习“Python免费学习笔记（深入）”；

安装Python库： 需要

ffmpeg-python

和

opencv-python

。用pip安装：

pip install ffmpeg-python opencv-python

编写Python代码：

听脑AI

听脑AI语音，一款专注于音视频内容的工作学习助手，为用户提供便捷的音视频内容记录、整理与分析功能。

下载

import ffmpeg
import cv2
import numpy as np

def extract_keyframes(video_path, output_dir, threshold=20):
    """
    提取视频关键帧。

    Args:
        video_path: 视频文件路径。
        output_dir: 关键帧保存目录。
        threshold: 帧差异阈值，越大提取的关键帧越少。
    """
    try:
        # 使用FFmpeg获取视频帧
        out, err = (
            ffmpeg
            .input(video_path)
            .output('pipe:', format='rawvideo', pix_fmt='rgb24')
            .run(capture_stdout=True, capture_stderr=True)
        )
    except ffmpeg.Error as e:
        print(f"FFmpeg error: {e.stderr.decode()}")
        return

    video = cv2.VideoCapture(video_path)
    fps = video.get(cv2.CAP_PROP_FPS)
    width = int(video.get(cv2.CAP_PROP_FRAME_WIDTH))
    height = int(video.get(cv2.CAP_PROP_FRAME_HEIGHT))
    frame_count = int(video.get(cv2.CAP_PROP_FRAME_COUNT))

    # 将FFmpeg输出的字节数据转换为NumPy数组
    video_frames = np.frombuffer(out, np.uint8).reshape([-1, height, width, 3])

    prev_frame = None
    keyframe_count = 0

    for i, frame in enumerate(video_frames):
        current_frame_gray = cv2.cvtColor(frame, cv2.COLOR_RGB2GRAY)

        if prev_frame is not None:
            # 计算当前帧与前一帧的差异
            diff = cv2.absdiff(prev_frame, current_frame_gray)
            mean_diff = np.mean(diff)

            if mean_diff > threshold:
                # 保存关键帧
                output_path = f"{output_dir}/keyframe_{keyframe_count:04d}.jpg"
                cv2.imwrite(output_path, frame)
                print(f"保存关键帧: {output_path} (帧号: {i}, 时间: {i/fps:.2f}s)")
                keyframe_count += 1

        prev_frame = current_frame_gray

    print(f"总共提取了 {keyframe_count} 个关键帧。")

if __name__ == "__main__":
    video_path = "your_video.mp4"  # 替换成你的视频文件路径
    output_dir = "keyframes" # 替换成你想要保存关键帧的目录
    import os
    os.makedirs(output_dir, exist_ok=True)
    extract_keyframes(video_path, output_dir)

运行代码： 把
```
your_video.mp4
```
替换成你的视频文件路径，运行Python脚本，关键帧就会保存到指定的目录里。

如何调整关键帧提取的灵敏度？

调整代码里的

threshold

参数。这个参数代表帧与帧之间的差异阈值。值越大，表示容忍的差异越大，提取的关键帧就越少；值越小，提取的关键帧就越多。可以根据视频内容调整这个值，比如动作剧烈的视频，阈值可以适当调高，反之则调低。

除了帧差异，还有哪些关键帧提取方法？

基于聚类的方法： 将视频帧的特征（比如颜色直方图、SIFT特征）提取出来，然后用聚类算法（比如K-means）将相似的帧聚成一类，每一类的中心帧就作为关键帧。
基于镜头分割的方法： 先把视频分割成不同的镜头，每个镜头选取一到两帧作为关键帧。镜头分割可以用边缘检测、运动分析等方法。
基于深度学习的方法： 用卷积神经网络（CNN）提取视频帧的特征，然后用循环神经网络（RNN）学习视频的时间序列信息，最后用一个分类器判断哪些帧是关键帧。这种方法效果通常最好，但计算量也最大。

为什么FFmpeg这么重要？

FFmpeg是一个开源的音视频处理工具，支持各种音视频格式的编解码、转换、流媒体处理等等。在Python里，我们可以通过

ffmpeg-python

这个库来调用FFmpeg的功能，实现各种复杂的音视频处理任务，比如视频转码、裁剪、合并、添加水印，当然也包括关键帧提取。没有FFmpeg，Python处理音视频会非常麻烦，需要自己实现底层的编解码算法，这几乎是不可能的。所以，FFmpeg是Python音视频处理的基石。

Python Django后台怎么配_自带Admin站点注册模型及自定义字段显示过滤与搜索

Python Tkinter Frame怎么用_容器组件分组管理UI元素与实现复杂布局的嵌套结构

Python如何排查模块冲突_sys.path与环境变量加载顺序分析

Python版本差异说明_Python2与3核心变化

Python怎么写限流(Rate Limit)_基于Redis的API频率控制

相关专题

pip安装使用方法

安装步骤：1、确保Python已经正确安装在您的计算机上；2、下载“get-pip.py”脚本；3、按下Win + R键，然后输入cmd并按下Enter键来打开命令行窗口；4、在命令行窗口中，使用cd命令切换到“get-pip.py”所在的目录；5、执行安装命令；6、验证安装结果即可。大家可以访问本专题下的文章，了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容，请阅读专题下面的文章。

437

2024.12.20

pip设置清华源

设置方法：1、打开终端或命令提示符窗口；2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件；3、打开pip.conf文件，然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容，这将把pip的镜像源设置为清华大学的镜像源；4、保存并关闭文件即可。

803

2024.12.23

python升级pip

本专题整合了python升级pip相关教程，阅读下面的文章了解更多详细内容。

371

2025.07.23

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

500

2023.08.14

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

174

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

热门下载

网站特效

网站源码

网站素材

前端模板