正则表达式疑问-PHP中文网问答

微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

正则表达式疑问

高洛峰 2016-11-11 13:18:16

[Python讨论组]

5035

我用爬虫爬到了一段页面

div id="middle">

 我的日志

Windows RDP CASE 小结

2015-12-29 13:00:48 分类：未分类权限：完全公开

首先介绍下Windows 2008 下远程桌面这个role

这个Role的作用在于可以同时让3个或者3个以上的用户RDP到这台机器上，所以不安装这个并不表示无法RDP，而是不能多人同时RDP而已。

理清了这个疑问后，开始进入正题。

有一个case说无法RDP到一台Windows Server上，并且port 3389 telnet 不通。

通过VC连上这台VM后发现本地也是无法telnet 3389的。

检查service中RDP service is enable and running.

很奇怪... 于是去检查防火墙，发现防火墙是disable的。

于是就漏掉了一个关键点！

Windows Firewall disable 并不表示防火墙没有生效，因此之后在service 中 enable firewall 服务后。

发现防火墙配置中域网络防火墙是启用的，关闭对应选项。ＲＤＰ成功

转发[0] 评论[] 收藏[0]

我需要用正则爬取所有的内容，并且遇到图片就把图片下载下来。

那么正则如何爬取一大段的内容？ re如何去写？

求各位大神指点一下.

谢谢！！

高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。网络人气名人讲师，...

全部回复(2)

欧阳克2016-11-11 13:19:14 2楼

不知你是否要抽取img标签下base64编码的图像内容;

如果是的话, 参考一下正则src="(data[^"]*)", 匹配时最好指定选项为不区分大小写;

import re
import pprint

contents = open('html.txt').readlines()
for line in contents:
    matched = re.search(r'''src="(data[^"]*)"''', line, re.I)
    if matched:
        pprint.pprint(matched.groups()[0])

λ  ~/  python x.py 
'data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAnUAAA...'

赞 +0

添加回复

三叔2016-11-11 13:18:43 1楼

php请使用simpleHTML我记得是这个类

赞 +0

添加回复

专题推荐

更多>

热门话题

热门教程

更多>