0

0

Pandas怎么画直方图_df.plot.hist(bins=20)快速看数据分布区间

P粉602998670

P粉602998670

发布时间:2026-03-13 11:36:31

|

411人浏览过

|

来源于php中文网

原创

df.plot.hist()不显示图形的主因是未触发Matplotlib渲染,Jupyter中需省略分号,脚本中须加plt.show();多列默认叠加导致重叠,应指定单列或调整alpha;bins仅为建议值,严格控柱需用np.arange;中文乱码需预设字体。

pandas怎么画直方图_df.plot.hist(bins=20)快速看数据分布区间

df.plot.hist() 画出来的直方图不显示、空白或报错

常见现象是调用 df.plot.hist() 后没出图,或者 Jupyter 里只显示一个空坐标轴。根本原因通常是没触发绘图渲染——Pandas 底层用的是 Matplotlib,但默认不自动 plt.show()

  • 在 Jupyter 中,确保单元格末尾**不加分号**(df.plot.hist(); 会抑制输出)
  • 如果用了脚本运行(.py 文件),必须显式加 plt.show(),否则图形对象生成了但不会弹窗
  • 检查是否漏装依赖:matplotlib 是必需的,df.plot.hist() 不会报 ImportError,但会静默失败

想画单列直方图却出来多列叠加,或者 x 轴标签挤成一团

这是 df.plot.hist() 的默认行为:它会对 DataFrame 所有数值列都画直方图,并自动叠加(stacked=False)。如果你只传入一列,比如 df['age'].plot.hist(),那没问题;但用 df.plot.hist() 时,只要 DataFrame 里有多个数值列,就会全画,且共享 x 轴范围,导致重叠难读。

  • 明确指定列:df[['age']].plot.hist(bins=20)(注意双括号返回 DataFrame,单括号是 Series)
  • 或者直接用 Series 接口:df['age'].plot.hist(bins=20),更干净,x 轴自动适配该列范围
  • 如果真要多列对比,加 alpha=0.7 降低透明度,避免颜色糊成一块

bins=20 没效果,或者直方图柱子数远少于预期

bins 参数不是强制柱子数,而是“建议分组数”。Matplotlib 会根据数据分布和算法(如 'auto')再调整实际分箱点,尤其当数据量小或存在大量重复值时,bins=20 可能被降级到 5–10 根柱子。

Mokker AI
Mokker AI

AI产品图添加背景

下载
  • 想严格控制柱子数量,改用 np.arange() 手动设 bins:df['score'].plot.hist(bins=np.arange(0, 101, 5))(每 5 分一档)
  • 查看实际分箱结果:执行后打印 ax = df['score'].plot.hist(bins=20); print(len(ax.patches))patches 数量才是真实柱子数
  • 离散整数型数据(如评分 1–5)慎用大 bins,容易产生大量空柱,应优先用 value_counts().plot.bar()

中文标签乱码、字体太小、坐标轴刻度不合理

Pandas plot 封装了 Matplotlib,但不接管字体和刻度逻辑。中文路径、标题、x 轴 tick 默认会显示为方块,且小数据量下刻度可能只标整数边界,看不出分布细节。

  • 解决乱码:提前设置 Matplotlib 字体,例如 plt.rcParams['font.sans-serif'] = ['SimHei', 'Arial Unicode MS'],并加 plt.rcParams['axes.unicode_minus'] = False
  • 放大刻度密度:画完图后调用 ax.xaxis.set_major_locator(plt.MaxNLocator(10)) 强制最多 10 个主刻度
  • 避免科学计数法:对大数值列,先做缩放(如除以 1000),再画图,比硬调 ticklabel_format 更稳
直方图看着简单,但 df.plot.hist() 的每个参数背后都连着 Matplotlib 的底层逻辑,尤其是 bins 和坐标轴渲染,最容易在换环境或换数据时突然失效。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

80

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

32

2026.01.31

python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

193

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

19

2026.02.03

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1946

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

658

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2401

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

47

2026.01.19

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

25

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号