0

0

Python决策树怎么画_分类树与回归树模型训练及Graphviz结构可视化

P粉602998670

P粉602998670

发布时间:2026-03-12 12:42:01

|

168人浏览过

|

来源于php中文网

原创

sklearn.tree.plot_tree是最轻量的决策树可视化方案,需传入已训练模型及feature_names等参数;分类树value为各类样本数,回归树value为预测值;export_graphviz需系统级Graphviz支持且注意precision等参数。

python决策树怎么画_分类树与回归树模型训练及graphviz结构可视化

怎么用 plot_tree 快速画出决策树结构图

不用 Graphviz 也能看树,sklearn.tree.plot_tree 是最轻量的方案。它直接在 matplotlib 里渲染,适合快速检查分裂逻辑、深度、样本数分布。

常见错误是传入未训练的模型——plot_tree 要求模型已调用 fit();另外默认不显示特征名和类别名,图看起来像天书。

  • 必须传入已训练的 DecisionTreeClassifierDecisionTreeRegressor
  • feature_names=feature_namesclass_names=class_names(分类树才需要)才能看懂节点含义
  • 小树用 max_depth=3 控制显示层级,否则深层树会挤成一团
  • 回归树的 class_names 参数无效,别传;它的叶节点显示的是预测值(value)而非类别
from sklearn.tree import plot_tree
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
plot_tree(clf, feature_names=iris.feature_names, class_names=iris.target_names, filled=True, rounded=True, fontsize=10)
plt.show()

Graphviz 导出 PDF/SVG 需要绕过哪些环境坑

想导出高清矢量图(比如插论文),就得走 export_graphviz + graphviz 工具链。真正卡住人的从来不是 Python 代码,而是系统级依赖。

典型现象:跑 dot -V 报错 command not found,或 Python 里提示 ExecutableNotFound: failed to execute ['dot']

立即学习Python免费学习笔记(深入)”;

Sora
Sora

Sora是OpenAI发布的一种文生视频AI大模型,可以根据文本指令创建现实和富有想象力的场景。

下载
  • Mac 用户装了 graphviz Python 包,但没装系统级 graphviz 二进制(brew install graphviz 缺一不可)
  • Windows 用户装完 Graphviz 安装包后,必须手动把 dot.exe 所在路径(如 C:\Program Files\Graphviz2.44\bin)加进系统 PATH
  • Conda 环境下慎用 conda install python-graphviz,它不装 dot,推荐 conda install -c conda-forge python-graphviz graphviz
  • export_graphviz 输出的是 DOT 文本,得用 Source(来自 graphviz 包)封装后才能 render,不能直接写文件再双击打开

分类树和回归树在可视化时的关键差异

同一个 plot_tree 函数,画分类树和回归树时表现不同,不是 bug,是设计使然。忽略这点会导致误读叶节点数值。

比如你看到一个叶节点标着 value = [12.3],这在分类树里毫无意义(该是数组计数),但在回归树里就是预测值。

  • 分类树的 value 是各类别样本数量数组,如 [5, 0, 17] 表示该叶有 5 个 class 0、0 个 class 1、17 个 class 2
  • 回归树的 value 是标量数组,如 [14.2],即该叶所有样本目标值的均值(也是预测输出)
  • filled=True 下,分类树按类别分布上色,回归树按预测值大小上色(颜色深浅对应数值高低)
  • 回归树不支持 class_names,传了会静默忽略;分类树若没传 class_names,只显示数字索引

为什么 export_graphvizprecisionrounded 很关键

默认导出的 DOT 文件里,分裂阈值和 impurity 值全是长浮点数(如 0.49999999999999994),不仅难读,还可能因精度问题导致 Graphviz 渲染失败或报 warning。

这不是显示问题,是底层解析容错性问题——某些旧版 dot 对超长小数处理不稳定。

  • precision=2 把所有数字截到小数点后两位,既干净又不影响理解分裂逻辑
  • rounded=True 让 Graphviz 自动对数字加千分位逗号和四舍五入,比纯 truncating 更稳妥
  • 别依赖 proportion=True 来“美化” value 显示,它把计数转成比例,反而让调试样本分布变得更麻烦
  • 如果树很深,务必加 max_depth=3,否则生成的 DOT 文件可能超百 MB,dot 渲染直接卡死
字体小、边框密、叶节点堆叠——这些不是图的问题,是树本身太复杂。可视化只是镜子,照出来的是模型结构的真实密度。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

443

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

class在c语言中的意思
class在c语言中的意思

在C语言中,"class" 是一个关键字,用于定义一个类。想了解更多class的相关内容,可以阅读本专题下面的文章。

870

2024.01.03

python中class的含义
python中class的含义

本专题整合了python中class的相关内容,阅读专题下面的文章了解更多详细内容。

30

2025.12.06

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1496

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1170

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

835

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

463

2023.08.02

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.9万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号