0

0

Python构建人脸识别系统的特征提取与模型训练路径【教学】

冰川箭仙

冰川箭仙

发布时间:2025-12-19 22:19:02

|

110人浏览过

|

来源于php中文网

原创

人脸识别核心是将人脸转为128维特征向量,用face_recognition提取、svm/knn分类,需规范数据组织、标准化与阈值比对。

python构建人脸识别系统的特征提取与模型训练路径【教学】

用Python做人脸识别,核心是把人脸变成一串有区分度的数字(特征向量),再用这些数字训练模型做比对或分类。不依赖黑盒API,从特征提取到模型训练,关键在选对工具链、数据组织合理、训练目标明确。

用dlib或face_recognition提取128维人脸特征

推荐初学者从 face_recognition 入手——它底层调用dlib的HOG+CNN人脸检测器和预训练ResNet模型,一行代码就能得到稳定可靠的128维特征向量。

  • 安装:pip install face_recognition(注意需先装dlib,Windows用户建议用conda安装)
  • 提取单张人脸特征:encoding = face_recognition.face_encodings(image)[0],返回长度为128的numpy数组
  • 一张图含多张脸?用face_recognition.face_locations()先定位,再逐区域编码,避免混入背景干扰
  • 注意图像格式:必须是RGB(不是BGR),且像素值为uint8(0–255),OpenCV读图后记得cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

构建带标签的人脸特征数据集(非原始图像)

真正训练时,你不需要反复加载和编码原始图片——那样太慢。应该提前把所有人脸转成特征向量+标签,存成结构化数据。

  • 遍历每人多张照片,提取特征并打上姓名/ID标签,汇总为两个numpy数组:X(shape: N×128)和y(shape: N,)
  • 保存为.npz文件:np.savez('face_data.npz', X=X, y=y, names=names),下次直接加载,秒级就绪
  • 每人至少3–5张不同角度/光照的照片,避免单样本过拟合;剔除模糊、遮挡严重或编码失败(len(encoding)==0)的样本

用SVM或KNN做轻量级身份分类训练

128维特征本身已具备强判别性,无需复杂深度网络。传统机器学习模型足够胜任小规模人脸识别(几十到几百人)。

Jenni AI
Jenni AI

使用最先进的 AI 写作助手为您的写作增光添彩。

下载

立即学习Python免费学习笔记(深入)”;

  • KNN最直观:from sklearn.neighbors import KNeighborsClassifier,k设为3–5,适合快速验证流程
  • SVM更鲁棒:from sklearn.svm import SVC,推荐用rbf核,配合GridSearchCV调参(C和gamma)
  • 训练前务必标准化:from sklearn.preprocessing import StandardScaler,虽然128维特征本身分布较均衡,但标准化能提升SVM收敛稳定性
  • 交叉验证不可少:用cross_val_score看平均准确率,避免因数据划分偶然性高估效果

部署时用特征比对替代实时训练

上线后,模型固定,新来的人脸只需提取特征,与已有特征库比对距离(如欧氏距离),设定阈值即可判断是否为注册用户或未知人脸。

  • 比对逻辑示例:distances = np.linalg.norm(known_encodings - unknown_encoding, axis=1),取最小距离对应ID
  • 阈值经验参考:face_recognition默认0.6,低于此值认为匹配;实际项目中建议用测试集绘制距离分布直方图,按误识率(FAR)反推合理阈值
  • 不推荐在线训练模型(如持续fit新样本),易导致概念漂移;新增人员应走“特征提取→追加数据→离线重训”闭环

基本上就这些。特征提取靠成熟库保底,数据组织决定扩展性,模型选择讲求实效——不复杂但容易忽略细节。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

432

2024.12.20

pip设置清华源
pip设置清华源

设置方法:1、打开终端或命令提示符窗口;2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件;3、打开pip.conf文件,然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容,这将把pip的镜像源设置为清华大学的镜像源;4、保存并关闭文件即可。

797

2024.12.23

python升级pip
python升级pip

本专题整合了python升级pip相关教程,阅读下面的文章了解更多详细内容。

370

2025.07.23

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1408

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1161

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

832

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

461

2023.08.02

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

19

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.8万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号