0

0

使用 Python 和 Matplotlib 在文本中绘制字符

王林

王林

发布时间:2023-04-29 19:31:05

|

1159人浏览过

|

来源于51CTO.COM

转载

本文的目的是帮助您开始在 python 中绘制数据。 我们将创建一个条形图来绘制给定文本文件中字符的频率。 在这种情况下,文本文件包含了《了不起的盖茨比》的内容。

使用 Python 和 Matplotlib 在文本中绘制字符

第 1 步:创建您的虚拟环境

这个项目的环境会比较小。 虚拟环境允许您向工作区添加额外的功能,而不会影响计算机的其余部分!

创建一个目录并在代码编辑器和终端(运行命令的地方)中打开它。

让我们运行:

$ python3 -m venv venv
$ source venv/bin/activate

我们可以安装我们必要的依赖项

$ pip3 install matplotlib

我们还要创建两个文件,read.txt 和 wordcount.py。

我们将使用 wordcount.py 来分析 read.txt 中的文本。

第 2 步:阅读文本

我们可以比较简单的开始,

import matplotlib.pyplot as plt # plot
from collections import OrderedDict # this will be used for sorting later

file = open('read.txt')
text = file.read()
file.close()
  • 首先,它导入我们的绘图和排序库
  • 其次,我们使用内置的 open 函数,它允许我们打开一个文件进行读写
  • 然后我们读取文件里面的文本并将其存储到文本变量中
  • 最后,我们关闭文件,因为我们不再使用它了

这就是我们“读取”文件并将内容存储在变量中所需的全部内容。

第 3 步:分析字符

我们可以跟踪字符的最好方法是使用 python 字典(在其他编程语言中称为 hashmap)。

字典是一种非常有用的数据存储方式。 就像真正的字典一样,它会有一个“单词”列表,您可以查看单词以查看定义。

在编程中,这个概念被推广到“键/值”对。 这意味着我们可以设置字典,当我向字典询问“a”时,它将返回“a”出现的总次数。

所以让我们编码吧!

charDict = {} # dictionaries are defined by curly braces
def count_letter(character):
character = character.lower()
if character.isspace():
return
if character in charDict:
charDict[character] = charDict[character] + 1
else:
charDict[character] = 1

# loop through text
for i in text:
count_letter(i)

charDict = OrderedDict(sorted(charDict.items()))

让我们回顾一下这里发生了什么。

  • 首先我们定义一个空字典
  • 接下来我们使用 def 关键字定义一个函数。 这个函数接受一个变量“字符”,检查它是否是一个空格(空格、制表符、换行符)。 您可以为您的选择添加其他标准,例如 isalpha() 以确定字符是否为字母
  • 然后检查它是否已经在字典中。 如果它在字典中,它会将值更改为之前的值加 1(因为我们正在计算这个字符),否则它将在字典中添加一个初始计数为 1 的新条目
  • 然后我们遍历文本变量中的每个字符,其中“i”代表一个单独的字符,我们保存并运行我们的函数来计算它们
  • 最后,我们使用 OrderdedDict 导入按字母顺序对字典进行排序

第4步:画出来!

现在我们的数据集已创建,让我们将其组织成轴并绘制它!

我们将创建一个列表来表示每个轴

num_list = []
char_list = []

这些列表将相互对应,因此如果 char_list 中的第 1 项是“a”,则 num_list 中的第 1 项将是相应的频率。 让我们也把它编码出来。

char_list = [] # character
num_list = [] # frequency
# create x and y axes
for x,y in charDict.items():
char_list.append(x)
num_list.append(y)

我们使用两个变量循环遍历我们创建的字典中的键/值对,然后将它们添加到我们的数据列表中。

最后让我们使用 matplotlib 创建并保存这个条形图。

fig = plt.figure() # create a new figure
ax = fig.add_subplot() # create a new bar graph within the figure
fig.canvas.manager.set_window_title('The Great Gatsby') # title of window
ax.bar(char_list, num_list) # add the data to the graph
plt.savefig('chars.png') # download an image of the bar graph
plt.show() # show the image
  • 首先,我们创建一个新图形。 图为整体窗口
  • 向图中添加绘图
  • 使用我们选择的数据添加条形图
  • 下载图片
  • 显示图像

是时候测试它了!

使用下面的代码运行您的文件,为我们的结果做好准备!

html5全屏可拖拽的横向图片布局
html5全屏可拖拽的横向图片布局

html5基于TweenMax来制作拖拽图片预览动画特效。拖拽效果使用的是Draggabilly插件。这是一款html5和CSS3可拖拽的横向图片预览布局。该布局将所有图片在屏幕中央进行横向排布,可以通过鼠标前后拖拽图片。当点击图片的标号数字时,隐藏所有的缩略图,在屏幕上显示当前被点击的图片放大,文本内容展示效果。

下载
$ python3 wordcount.py

使用 Python 和 Matplotlib 在文本中绘制字符

所以要回答我在文章开头提出的问题,字母 e 在《了不起的盖茨比》中被使用了超过 25,000 次! 哇!

结论

在本文结束时,我希望您对 matplotlib 和数据科学有所了解。

相关文章

python速学教程(入门到精通)
python速学教程(入门到精通)

python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

0

2026.01.20

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

53

2026.01.19

java用途介绍
java用途介绍

本专题整合了java用途功能相关介绍,阅读专题下面的文章了解更多详细内容。

57

2026.01.19

java输出数组相关教程
java输出数组相关教程

本专题整合了java输出数组相关教程,阅读专题下面的文章了解更多详细内容。

35

2026.01.19

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.19

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

10

2026.01.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

15

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

130

2026.01.18

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

138

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 4.7万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号