摔倒检测，基于骨骼点人体动作识别，部分代码用 Chatgpt 完成

PHPz

发布时间：2023-04-12 08:19:02

2946人浏览过

来源于51CTO.COM

转载

哈喽，大家好。

今天给大家分享一个摔倒检测项目，准确地说是基于骨骼点的人体动作识别。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

大概分为三个步骤

识别人体
识别人体骨骼点
动作分类

项目源码已经打包好了，获取方式见文末。

0. chatgpt

首先，我们需要获取监控的视频流。这段代码比较固定，我们可以直接让chatgpt完成

chatgpt写的这段代码是没有问题的，可以直接使用。

但后面涉及到业务型任务，比如：用mediapipe识别人体骨骼点，chatgpt给出的代码是不对的。

我觉得chatgpt可以作为一个工具箱，能独立于业务逻辑，都可以试着交给chatgpt完成。

所以，我觉得未来对程序员的要求会更加注重业务抽象的能力。扯远了，言归正传。

1. 人体识别

人体识别可以用目标检测模型，比如：YOLOv5，之前我们也分享过好多训练YOLOv5模型的文章。

但这里我没有用YOLOv5，而是用mediapipe。因为mediapipe运行速度更快，在 CPU 上也能流畅地运行。

2. 骨骼点识别

识别骨骼点的模型有很多，如：alphapose、openpose，每种模型识别出来的骨骼点个数和位置都有所差异。比如下面这两种：

mediapipe 32个骨骼点

coco 17个骨骼点

骨骼点的识别我仍然使用mediapipe，除了速度快，另一个优势是mediapipe识别的骨骼点多，有 32 个，能满足我们的使用。因为下面要用的人体动作分类，强依赖于骨骼点。

image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
results = pose.process(image)

if not results.pose_landmarks:
continue

# 识别人体骨骼点
image.flags.writeable = True
image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)

mp_drawing.draw_landmarks(
image,
results.pose_landmarks,
mp_pose.POSE_CONNECTIONS,
landmark_drawing_spec=mp_drawing_styles.get_default_pose_landmarks_style()
)

3. 动作识别

动作识别使用的是基于骨架动作识别的时空图卷积网络，开源方案是STGCN（Skeleton-Based Graph Convolutional Networks）

https://github.com/yysijie/st-gcn

一组动作，如：摔倒，由 N 帧组成，每一帧可以构造出以骨骼点坐标组成的空间图，骨骼点在帧之间连接起来就构成时间图，骨骼点的连接和时间帧的连接便可以构造一张时空图。

CreateWise AI

为播客创作者设计的AI创作工具，AI自动去口癖、提交亮点和生成Show notes、标题等

下载

时空图

在时空图上进行多层图卷积运算，便可生成更高层次的特征图。然后输入到SoftMax分类器进行动作分类(Action Classification)。

图卷积

本来我打算训练STGCN模型的，但遇到的坑实在是太多了，最后直接用了别人训练好的模型。

坑1. STGCN 支持 OpenPose 识别的骨骼点，有数据集Kinetics-skeleton可以直接用。坑的地方在于OpenPose安装太麻烦，需要一堆步骤，挣扎后放弃。

坑2. STGCN 还支持 NTU RGB+D数据集，该数据集有 60 个动作分类，如：起立、行走、摔倒等。这份数据集的人体包含 25 个骨骼点，只有坐标数据，原始视频基本搞不到，所以没办法知道这 25 个骨骼点对应哪些位置，以及用什么模型能识别出这 25 个骨骼点，挣扎后放弃。

上面两个大坑，导致没法直接训练STGCN模型，找了一个开源的方案，它用的是alphapose识别 14 个骨骼点，同时修改STGCN源码支持自定义骨骼点。

https://github.com/GajuuzZ/Human-Falling-Detect-Tracks

我看了下mediapipe包含了这 14 个骨骼点，所以可以用mediapipe识别的骨骼点输入他的模型，实现动作分类。

mediapipe 32个骨骼点

选出14个关键骨骼点

14个骨骼点提取代码：

KEY_JOINTS = [
mp_pose.PoseLandmark.NOSE,
mp_pose.PoseLandmark.LEFT_SHOULDER,
mp_pose.PoseLandmark.RIGHT_SHOULDER,
mp_pose.PoseLandmark.LEFT_ELBOW,
mp_pose.PoseLandmark.RIGHT_ELBOW,
mp_pose.PoseLandmark.LEFT_WRIST,
mp_pose.PoseLandmark.RIGHT_WRIST,
mp_pose.PoseLandmark.LEFT_HIP,
mp_pose.PoseLandmark.RIGHT_HIP,
mp_pose.PoseLandmark.LEFT_KNEE,
mp_pose.PoseLandmark.RIGHT_KNEE,
mp_pose.PoseLandmark.LEFT_ANKLE,
mp_pose.PoseLandmark.RIGHT_ANKLE
]

landmarks = results.pose_landmarks.landmark
joints = np.array([[landmarks[joint].x * image_w,
landmarks[joint].y * image_h,
landmarks[joint].visibility]
 for joint in KEY_JOINTS])

STGCN原始方案构造的空间图只支持openpose18个骨骼点和NTU RGB+D数据集25个骨骼点

修改这部分源码，以支持自定义的14个骨骼点

模型直接使用Human-Falling-Detect-Tracks项目已经训练好的，实际运行发现识别效果很差，因为没有看到模型训练过程，不确定问题出在哪。

有能力的朋友可以自己训练模型试试，另外，百度的Paddle也基于STGCN开发了一个跌倒检测模型，只支持摔倒这一种行为的识别。

当然大家也可以试试Transformer的方式，不需要提取骨骼点特征，直接将 N 帧图片送入模型分类。

关于STGCN的原理，大家可以参考文章：https://www.jianshu.com/p/be85114006e3 总结的非常好。

需要源码的朋友留言区回复即可。

如果大家觉得本文对你有用就点个在看鼓励一下吧，后续我会持续分享优秀的 Python+AI 项目。

ChatGPT如何生成小红书文案_ChatGPT社交文案创作流程【介绍】

ChatGPT怎么跨设备同步使用_ChatGPT多平台登录使用介绍【介绍】

ChatGPT论文提纲怎么生成_写作方法是什么【指南】

ChatGPT批量写工作总结怎么实现_高效提示方法是什么【介绍】

ChatGPT生成Python代码怎么提问_提示写法是什么【教程】

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

178

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

227

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

532

2026.03.04