0

0

Python 文件上传的病毒扫描

舞姬之光

舞姬之光

发布时间:2026-02-19 15:43:02

|

942人浏览过

|

来源于php中文网

原创

必须校验文件后缀、mime类型及内容:用python-magic检测前1024字节,仅允白名单mime;clamav须用instream内存扫描并处理连接异常,禁跳过小文件扫描。

python 文件上传的病毒扫描

上传前必须校验文件后缀和 MIME 类型

光靠 filename 后缀判断类型极不可靠,攻击者随便改个 .jpg 后缀就能传入恶意可执行文件。浏览器发来的 Content-Type 也完全不可信,能被任意篡改。

真正有效的做法是读取文件前几百字节,用 python-magic 做实际内容检测:

import magic<br>mime = magic.from_buffer(file_bytes, mime=True)

只允许白名单 MIME 类型,比如 image/jpegapplication/pdf,拒绝 application/x-executabletext/html(HTML 文件可能含 XSS 或下载诱导脚本)。

  • 别用 file.content_type —— 它只是 HTTP 请求头里的字符串,毫无约束力
  • magic.from_file() 不能用于临时上传流,必须用 from_buffer() 配合 read(1024)
  • 某些 PDF 病毒会伪装成 application/pdf,但真实扫描需更深层分析,这一步只是基础过滤

调用 ClamAV 扫描时别直接传文件路径

用户上传的文件若直接落盘再传给 clamdscanclamscan,存在竞态条件:文件刚写完、还没扫完,就被另一个进程或脚本读取执行了。更糟的是,如果路径可控,还可能触发路径遍历(比如传 ../../../.ssh/id_rsa)。

立即学习Python免费学习笔记(深入)”;

正确姿势是走内存或 socket 通信,避免落地:

Molica AI
Molica AI

一款聚合了多种AI工具的一站式创作平台

下载
import clamd<br>cd = clamd.ClamdAgnostic()<br>result = cd.instream(file_bytes)
  • instream() 把二进制内容直接发给 clamd 守护进程,不写磁盘,无路径风险
  • 确保 clamd 配置里 StreamMaxLength 足够大(默认 25M),否则大文件会返回 INSTREAM ERROR: Stream: File size limit exceeded
  • 如果用 clamscan 命令行,必须配合 tempfile.NamedTemporaryFile(delete=False) + 扫描后立即 os.unlink(),但依然不如 instream 干净

ClamAV 返回结果要区分 “未发现” 和 “扫描失败”

很多人只检查 result['stream'] == 'OK' 就放行,但 ClamAV 的响应结构其实有三种关键状态:

  • 'stream': 'OK' → 无病毒(安全)
  • 'stream': 'FOUND' → 发现病毒,result['stream'] 值是病毒名,如 Win.Trojan.Keylogger-12345
  • 根本没返回 'stream' 键,或抛出 clamd.ConnectionError / socket.timeout → 扫描异常,不能当“干净”处理

漏掉第三种情况等于留后门:ClamAV 服务挂了、超时了、配置错了,上传就自动通过。生产环境必须显式拦截这类异常,并记录日志,例如:

try:<br>    result = cd.instream(file_bytes)<br>except (clamd.ConnectionError, socket.timeout):<br>    raise RuntimeError("Virus scan unavailable")

小文件跳过扫描?别省这点 CPU

有人觉得 1KB 的文本文件不可能带病毒,就加逻辑跳过扫描。错。很多 Office 文档宏病毒、LNK 文件、恶意 PDF 元数据都只有几 KB,且 ClamAV 对小文件的 instream 调用耗时通常在毫秒级。

真正该优化的是并发和超时,不是按大小跳过:

  • ClamAV 默认单线程处理 instream,高并发下会排队,建议启用 clamdMaxThreads 配置
  • instream()timeout=30 参数,避免卡死(ClamAV 处理畸形 PDF 有时会 hang 住)
  • 如果真要限流,用请求队列或令牌桶,而不是基于文件大小做信任降级

病毒不挑体积,只挑疏忽。只要走上传流程,就得走全链路校验 —— 后缀、MIME、内容扫描,缺一不可。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

371

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

339

2023.10.25

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

573

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

216

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1553

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

640

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

945

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

896

2024.04.29

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

660

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 4.4万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号