0

0

htmlspecialchars和htmlentities处理特殊字符的一些思考

php中文网

php中文网

发布时间:2016-06-01 14:24:53

|

1620人浏览过

|

来源于php中文网

原创

在firefox中,使用“查看”菜单中的“页面源代码”查看html源代码 跟 选中要看的内容然后点击”查看选中部分的源代码“ ,得到的源代码不相同,我们宁可相信前者,而不要相信后者。举例来说:页面为gbk的,中有一个表单,通过表单中的输入框输入这个字符“・”,保存到数据 库中的是“・”,如果接着将它查出来在页面上显示(gbk字符),他会显示回原样:“・”,如果使用“查看选中部分的源代码”查 看,他的html源代码仍然是这个怪异的点号,但是如果使用“页面源代码”查看,他会现出原形“・”。同样很多字符也一样:❤

因为这个符号在数据库中以“・”保存(为什么要以这个保存,主要是因为你的页面是gbk的,无法正常传输这个字符,因此只能转换成特殊字符才能传到服务器),所以每次读出的时候如果不经过转换直接显示,也会显示为原来的那个点,但是我们一般在服务器端向客户端发送字符串时都要对其中的特殊字符进行处理,比如使用htmlentities函数。这样的话,就会将字符中的&转换为&,点号也就无法正常显示了。

在这个过程中,我考虑,我们应该按照什么流程来处理表单传入的字符串:(这里默认magic_quotes_gpc设置为0,以后任何项目中也推荐这样设置,如果gpc为1,那么首先对所有数据进行stripslashes处理):
 

       htmlspecialchars          mysql_real_escape       直接
form  ------------------------------>  -------------------------------> DB ---------> html
 


还是:

     mysql_real_escape        htmlspecialchars
form -------------------------------> DB ---------------------------------> html


其实我这里认为两者基本都一样,最后返回的html结果都正确,都能处理好数据。我之前使用的是第二种形式,其中遇到了一些问题,主要是在表单出错后返回,让客户修改数据重新提交时遇到的问题,原来是直接将表单提交的数据返回(不经过任何处理)重新赋给表单,但对于某些特殊的字符,比如单引号或者双引号,再返回时就 会出现异常的情况,或者不显示,或者显示不正常。于是需要我们对数据进行htmlspecialchars处理。于是我开始考虑第一个流程,如果表单验证错误,可以在htmlspecialchars后面返回,将数据重新赋给表单而不会导致表单内容出错的问题。但是第一个流程有个致命的问题,我们在数据库中要保存显示的数据呢还是要保存原始的数据呢?当然最好是原始的数据。因此我们还得使用第二个流程,在返回错误页面的时候,我们也得使用 htmlspecialchars进行转换,虽然比较麻烦,但这样不会出现问题。

在研究htmlentities和htmlspecialchars两个函数的不同点的过程中,我们测试这个字符传:“gbk鐘沒有的”。经过 htmlspecialchars($str, ENT_QUOTES),这个字符串没有改变。但是经过htmlentities($str)甚至htmlentities($str, ENT_QUOTES, 'GB2312')(应该是gbk,但这里不支持gbk),结果分别变为:“gbkç姏]ÓеĔ 和 “gbkç姏]有的”。于是决定不管在任何情况下都应该使用htmlspecialchars来代替htmlentities,同时也不需要自己写什么 _myhtmlentities来修复htmlentities原有的问题。当然htmlentities出现乱码的原因不光是因为它本身的问题,也是因 为传入的字符是在gbk中才有的,gb2312中没有,但只能使用gb2312来处理,于是出现错误。

arXiv Xplorer
arXiv Xplorer

ArXiv 语义搜索引擎,帮您快速轻松的查找,保存和下载arXiv文章。

下载

不过关于数据库中记录网页内容字符的问题,到底存真实的,还是html转义过的,我在一本很好的教材上看到并也认可:其实都可以,我个人现在用的是存转义后的字符,然后,从数据库取出时直接显示在网页,无论是文章标题还是内容。至于编码,当然是全utf8。宁可牺牲执行效率,也不为这个伤神。

立即学习前端免费学习笔记(深入)”;

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
go语言 注释编码
go语言 注释编码

本专题整合了go语言注释、注释规范等等内容,阅读专题下面的文章了解更多详细内容。

32

2026.01.31

go语言 math包
go语言 math包

本专题整合了go语言math包相关内容,阅读专题下面的文章了解更多详细内容。

23

2026.01.31

go语言输入函数
go语言输入函数

本专题整合了go语言输入相关教程内容,阅读专题下面的文章了解更多详细内容。

16

2026.01.31

golang 循环遍历
golang 循环遍历

本专题整合了golang循环遍历相关教程,阅读专题下面的文章了解更多详细内容。

5

2026.01.31

Golang人工智能合集
Golang人工智能合集

本专题整合了Golang人工智能相关内容,阅读专题下面的文章了解更多详细内容。

6

2026.01.31

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

268

2026.01.31

高干文在线阅读网站大全
高干文在线阅读网站大全

汇集热门1v1高干文免费阅读资源,涵盖都市言情、京味大院、军旅高干等经典题材,情节紧凑、人物鲜明。阅读专题下面的文章了解更多详细内容。

195

2026.01.31

无需付费的漫画app大全
无需付费的漫画app大全

想找真正免费又无套路的漫画App?本合集精选多款永久免费、资源丰富、无广告干扰的优质漫画应用,涵盖国漫、日漫、韩漫及经典老番,满足各类阅读需求。阅读专题下面的文章了解更多详细内容。

170

2026.01.31

漫画免费在线观看地址大全
漫画免费在线观看地址大全

想找免费又资源丰富的漫画网站?本合集精选2025-2026年热门平台,涵盖国漫、日漫、韩漫等多类型作品,支持高清流畅阅读与离线缓存。阅读专题下面的文章了解更多详细内容。

85

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号