0

0

Pandas怎么画箱线图_df.boxplot()查勘异常值与四分位数分布

P粉602998670

P粉602998670

发布时间:2026-03-12 17:57:21

|

575人浏览过

|

来源于php中文网

原创

df.boxplot()标出的异常值是IQR法识别的统计离群点,即超出[Q1−1.5×IQR, Q3+1.5×IQR]范围的点,以小圆点显示;需结合业务判断是否为真实错误。

pandas怎么画箱线图_df.boxplot()查勘异常值与四分位数分布

df.boxplot() 画出来的箱线图怎么看异常值

箱线图里超出上下须的点就是 df.boxplot() 标出的异常值,它默认用 IQR(四分位距)法判定:下界 = Q1 − 1.5×IQR,上界 = Q3 + 1.5×IQR,落在之外的点会被单独绘制成小圆点。

注意:这些“异常值”只是统计意义上的离群点,不等于数据错误。实际中得结合业务判断——比如用户下单金额为 0 或负数,那才是真问题;而某次活动期间的超高订单,可能完全合理。

  • 异常点颜色和大小不可直接通过 df.boxplot() 参数调整,得用 patch_artist=True + 后续 ax.findobj() 拿到散点再改,麻烦且易错
  • 若列含大量 NaNdf.boxplot() 会自动跳过,但不会报错,容易误以为数据全量参与了计算
  • 对非数值列(如 object 类型),df.boxplot() 直接静默跳过,不提示、不报错、也不画图

用 df.boxplot() 时 column 和 by 参数怎么选

column 控制画哪几列,by 控制按哪列分组——这是最常配错的两个参数。

比如想看不同部门(dept)下薪资(salary)的分布差异,该写:df.boxplot(column='salary', by='dept')。写成 df.boxplot(by='salary', column='dept') 就会报错或画出空图,因为 by 必须是分类变量,column 必须是数值变量。

  • column 可传字符串(单列)、字符串列表(多列),也可不填——此时默认对所有数值列画图
  • by 只接受单列名(字符串)或列名列表(用于多级分组),不能传函数或表达式
  • 如果 by 列含空值(NaN),对应行整行被丢弃,且不警告;若该列全是 NaN,则整个图为空白

df.boxplot() 和 plt.boxplot() 混用导致坐标轴错乱

直接调 df.boxplot() 会自动创建新 figure 和 axes;如果之前用了 plt.subplot()fig, ax = plt.subplots(),再调它就会破坏原有布局,常见表现为:图挤在左下角、x 轴标签重叠、甚至只显示一半箱子。

Sora
Sora

Sora是OpenAI发布的一种文生视频AI大模型,可以根据文本指令创建现实和富有想象力的场景。

下载

正确做法是把 ax 显式传进去:df.boxplot(column='value', ax=ax)。这样所有绘制都发生在你指定的 axes 上,能和其它图(如折线、散点)共存。

  • 传入 ax 后,df.boxplot() 不再返回 Figure,而是返回 Axes 对象,方便链式调用(如 .set_title()
  • 如果传了 ax 但该 axes 已有内容,箱线图会叠加绘制,不会清空——需手动调 ax.cla() 清屏
  • matplotlib 3.8+ 中,df.boxplot(..., figsize=()) 会被忽略,必须用 plt.figure(figsize=())fig.set_size_inches()

中文标签显示为方块或乱码怎么办

不是 df.boxplot() 的锅,是 matplotlib 默认字体不支持中文。只要在绘图前设置好字体,所有文字(坐标轴、标题、刻度)就都能正常显示。

最稳的方案是加载系统已有的中文字体,比如 macOS 用 'Heiti SC',Windows 用 'SimHei',Linux 常用 'WenQuanYi Zen Hei'。别硬写 plt.rcParams['font.sans-serif'] = ['SimHei'] 就完事——得确认该字体真实存在,否则还是方块。

  • matplotlib.font_manager.findSystemFonts(fontpaths=None, fontext='ttf') 查本机所有可用 ttf 字体路径,再用 FontProperties(fname=...) 加载更可靠
  • 设完字体后,记得加 plt.rcParams['axes.unicode_minus'] = False,否则负号会变成方块
  • 如果用 Jupyter,改完 rcParams 需重新运行绘图单元格,旧图不会自动刷新

箱线图本身逻辑简单,但和 pandas 索引、matplotlib 状态、字体环境一碰,就容易卡在某个不起眼的细节上——比如你以为是数据问题,其实是 by 列里混进了空格或不可见字符,导致分组失效。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

79

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

32

2026.01.31

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1566

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

649

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1228

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1204

2024.04.29

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号