python - 关于代码的优化问题-PHP中文网问答

微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

python - 关于代码的优化问题

ringa_lee 2017-04-18 10:29:11

[Python讨论组]

882

我新手写的代码，用来处理爬虫下来的htm文件内容,虽然解决问题，但是会有遗漏文件不处理。爬虫是爬一些文章的网站下来的，和网页另存为没什么区别。

想大神们帮我看看我的代码，怎么优化不会有遗漏。比较小白的代码，麻烦了！！！

# -*- coding: utf-8 -*
import re
import glob

filename_list = glob.glob('*.html')

for i in filename_list:
    txt = ""
    with open(i, "r") as htmfile:
        txt = htmfile.read()
    scdy = r"]*>', '', r) 
    threetxt=re.sub('


            
                
                    
                    1
                

                
                    
                                                    
                                            
                    0
                


                
                    
                                                    
                                            
                    0
                




            
            
            
            
            
            
            
            
            
            
            
            
            
            

            
                
                    
                    
                        ringa_lee
                        ringa_lee
                    
                
                
                    
                    
                        
                            
                        
                    
                
            
            
                
                    全部回复(1)
                    
                
                

                                
                    
                    
                        
                            
                                PHP中文网2017-04-18 10:31:11
                                1楼
                            
                            filename_list = glob.glob('.html') + glob.glob('.htm')
                            
                                 
                                赞 +0
                                
                                    添加回复
                                
                            
                                                            
                                    
                                        
                                            
                                                
                                                ringa_lee



        
        
            
            
                
                    专题推荐
                    更多>
                    
                
                

                    
                                                
                             
                            数据智能是什么意思 
                        
                                                
                             
                            央视体育为什么看不了直播 
                        
                                                
                             
                            删掉的通话记录怎么查 
                        
                                                
                             
                            too many logins怎么解决 
                        
                                            
                

            
            

                
                     热门话题 
                    
                
                
                    
                                                
                            
                                
                                漫蛙漫画-漫蛙manwa防走失官网登录入口
                            
                        
                                                
                            
                                
                                俄罗斯Yandex搜索引擎免登录入口 Yandex搜索引擎官网一键直达
                            
                        
                                                
                            
                                
                                怎么在电脑上定闹钟时间设置_Windows系统闹钟设置全攻略
                            
                        
                                                
                            
                                
                                如何在苹果手机上下载并安装OKX交易所
                            
                        
                                                
                            
                                
                                ArchiveofOurOwn官方网站地址 ArchiveofOurOwn镜像站官方访问链接
                            
                        
                                                
                            
                                
                                币圈三大交易所下载
                            
                        
                                                
                            
                                
                                比特币八大交易软件榜单 最受欢迎的比特币交易app盘点
                            
                        
                                                
                            
                                
                                俄罗斯搜索引擎Yandex使用方法 官方入口地址及浏览器简介
                            
                        
                                                
                            
                                
                                抖音网页版高画质在线观看 抖音网页版官方网址
                            
                        
                                                
                            
                                
                                Yandex官网登录入口_Yandex全球版访问
                            
                        
                                            
                
            
            
                
                    热门教程
                    更多>
                    
                
                
                    
                        相关教程 
                        热门推荐
                        最新课程
                    
                    
                                            
                    
                                                
                            
                                
                            
                            
                                JavaScript ES5基础线上课程教学
                                
                                    68069次学习

                                                                            收藏
                                                                    
                            
                        
                                                
                            
                                
                            
                            
                                最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)
                                
                                    1494219次学习

                                                                            收藏
                                                                    
                            
                        
                                                
                            
                                
                            
                            
                                phpStudy极速入门视频教程
                                
                                    531159次学习

                                                                            收藏
                                                                    
                            
                        
                                                
                            
                                
                            
                            
                                独孤九贱(4)_PHP视频教程
                                
                                    1254548次学习

                                                                            收藏
                                                                    
                            
                        
                                                
                            
                                
                            
                            
                                PHP实战天龙八部之仿爱奇艺电影网站
                                
                                    772232次学习

                                                                            收藏
                                                                    
                            
                        
                                            
                    
                                                
                            
                                
                            
                            
                                最新Python教程 从入门到精通
                                
                                    4078次学习

                                                                            收藏
                                                                    
                            
                        
                                                
                            
                                
                            
                            
                                JavaScript ES5基础线上课程教学
                                
                                    68069次学习

                                                                            收藏
                                                                    
                            
                        
                                                
                            
                                
                            
                            
                                PHP新手语法线上课程教学
                                
                                    7280次学习

                                                                            收藏
                                                                    
                            
                        
                                                
                            
                                
                            
                            
                                支付宝沙箱支付（个人也能用的支付）
                                
                                    4833次学习

                                                                            收藏
                                                                    
                            
                        
                                                
                            
                                
                            
                            
                                麻省理工大佬Python课程
                                
                                    44120次学习

                                                                            收藏
                                                                    
                            
                        
                                            
                
                
            
            
                
                    最新下载
                    更多>
                    
                

                                

                
                    
                        网站特效 
                        网站源码
                        网站素材
                        前端模板
                    
                    
                                                
                            
                                
                                [表单按钮] jQuery企业留言表单联系代码
                            
                        
                                                
                            
                                
                                [播放器特效] HTML5 MP3音乐盒播放特效
                            
                        
                                                
                            
                                
                                [菜单导航] HTML5炫酷粒子动画导航菜单特效
                            
                        
                                                
                            
                                
                                [表单按钮] jQuery可视化表单拖拽编辑代码
                            
                        
                                                
                            
                                
                                [播放器特效] VUE.JS仿酷狗音乐播放器代码
                            
                        
                                                
                            
                                
                                [html5特效] 经典html5推箱子小游戏
                            
                        
                                                
                            
                                
                                [图片特效] jQuery滚动添加或减少图片特效
                            
                        
                                                
                            
                                
                                [相册特效] CSS3个人相册封面悬停放大特效
                            
                        
                                            

                    
                                                
                            
                                
                                [电商源码] 互联在线商务频道 Build 1028
                            
                        
                                                
                            
                                
                                [电商源码] UQ云商B2B2C系统
                            
                        
                                                
                            
                                
                                [电商源码] ecshop仿苏宁易购程序
                            
                        
                                                
                            
                                
                                [电商源码] 淘源码商城米兰购物淘宝客
                            
                        
                                                
                            
                                
                                [电商源码] 网趣网上购物系统旗舰版
                            
                        
                                                
                            
                                
                                [电商源码] TP-COUPON 导购系统 免费版
                            
                        
                                                
                            
                                
                                [电商源码] 宝贝儿拍卖系统
                            
                        
                                                
                            
                                
                                [电商源码] IUser Ecommerce
                            
                        
                                            

                    
                                                
                            
                                
                                [psd素材] 特价小吃美食宣传海报PSD模板设计下载
                            
                        
                                                
                            
                                
                                [矢量素材] 秋季农场元素合集矢量素材
                            
                        
                                                
                            
                                
                                [psd素材] 紫色毛刺风格海报PSD源文件设计下载
                            
                        
                                                
                            
                                
                                [矢量素材] 双十一购物节促销传单矢量模板
                            
                        
                                                
                            
                                
                                [psd素材] 购物节促销折扣主题海报设计下载
                            
                        
                                                
                            
                                
                                [psd素材] 酒吧聚会宣传海报PSD源文件设计下载
                            
                        
                                                
                            
                                
                                [psd素材] 快餐美食招贴海报设计源文件下载
                            
                        
                                                
                            
                                
                                [矢量素材] 节日礼物包装袋合集矢量素材
                            
                        
                                            

                    
                                                
                            
                                
                                [前端模板] 驾照考试驾校HTML5网站模板
                            
                        
                                                
                            
                                
                                [前端模板] 驾照培训服务机构宣传网站模板
                            
                        
                                                
                            
                                
                                [前端模板] HTML5房地产公司宣传网站模板
                            
                        
                                                
                            
                                
                                [前端模板] 新鲜有机肉类宣传网站模板
                            
                        
                                                
                            
                                
                                [前端模板] 响应式天气预报宣传网站模板
                            
                        
                                                
                            
                                
                                [前端模板] 房屋建筑维修公司网站CSS模板
                            
                        
                                                
                            
                                
                                [前端模板] 响应式志愿者服务网站模板
                            
                        
                                                
                            
                                
                                [前端模板] 创意T恤打印店网站HTML5模板







    
        
            
                
                    
                        关于我们
                        免责申明
                        举报中心
                        意见反馈
                        讲师合作
                        广告合作
                        
                        最新更新
                        English
                                                
                    
                    php中文网：公益在线php培训，帮助PHP学习者快速成长！
                    
                      
                        关注服务号
                        
                          微信扫码
关注PHP中文网服务号
                          
                        
                      
                        
                        技术交流群
                        
                          QQ扫码
加入技术交流群
                          
                        
                      
                        
                    
                
                
            
            
                
                    
                    
                        PHP中文网订阅号
                        每天精选资源文章推送
                    
                
                
                    
                    
                        PHP中文网APP
                        随时随地碎片化学习
                    
                
            
        
    
    
        Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

    










    
        
            
                
                    
                    PHP学习
                
            
        
    
    
        
            
                
                    
                    技术支持
                
            
        
    
    
        
            
                
                    
                    返回顶部