0

0

DataTables:安全显示富文本内容,避免HTML渲染

霞舞

霞舞

发布时间:2025-12-02 12:24:30

|

868人浏览过

|

来源于php中文网

原创

DataTables:安全显示富文本内容,避免HTML渲染

本教程旨在解决datatables在加载包含html标签的数据时,意外渲染这些标签的问题。我们将探讨如何利用datatables的`columns.render`回调函数,结合jquery的`$.parsehtml`和dom元素的`innertext`属性,安全地提取纯文本内容并显示,从而防止恶意脚本执行和布局混乱。同时,也会介绍一种快速去除html标签的正则表达式方法,并强调数据源安全净化的重要性。

当DataTables加载包含HTML标签(如

, ,

,甚至<script>)的数据时,默认行为是直接将其作为HTML内容渲染到表格单元格中。这可能导致多种问题,包括:</script>

  • 布局混乱:HTML标签的样式和结构可能与表格的预期布局冲突。
  • 安全漏洞(XSS):如果数据来源于用户输入且未经过滤,恶意脚本标签(<script>)可能被执行,造成跨站脚本攻击。</script>
  • 数据展示不一致:希望显示纯文本而非渲染后的HTML。

本教程将提供两种主要方法来解决这些问题,并给出相应的代码示例和注意事项。

方法一:使用 columns.render 结合 $.parseHTML 提取纯文本

最推荐的方法是利用DataTables的columns.render选项,结合jQuery的$.parseHTML函数来安全地解析包含HTML的字符串,并提取其纯文本内容。这种方法能够有效防止HTML标签被渲染,同时也能抵御大部分XSS攻击。

工作原理

  1. columns.render: DataTables提供了一个render回调函数,允许你在数据被显示到单元格之前对其进行处理。
  2. $.parseHTML( '' + data + '' ): jQuery的$.parseHTML函数可以将一个HTML字符串解析成DOM节点数组。为了确保无论原始数据是否包含HTML,都能得到一个有效的DOM结构,我们建议将原始数据包裹在一个标签中。这样做可以处理以下情况:
    • 数据本身没有HTML标签。
    • 数据只在字符串中间包含HTML标签。
    • 数据以HTML标签开头或结尾。
  3. node.innerText: 解析后的DOM节点数组的第一个元素(即我们包裹的节点)可以通过innerText属性安全地获取其包含的所有纯文本内容,而忽略所有HTML标签。

示例代码

首先,确保你的HTML页面包含了DataTables和jQuery的必要库。

立即学习前端免费学习笔记(深入)”;

<!DOCTYPE html>
<html>
<head>
    <title>DataTables HTML 渲染控制</title>
    <meta charset="utf-8">
    <meta name="viewport" content="width=device-width, initial-scale=1">
    <link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/3.4.1/css/bootstrap.min.css">
    <script src="https://ajax.googleapis.com/ajax/libs/jquery/3.6.0/jquery.min.js"></script>
    <script src="https://cdn.datatables.net/1.10.1/js/jquery.dataTables.min.js"></script>
</head>
<body>
    <div class="container">
        <h2>DataTables 纯文本显示示例</h2>
        <table id="example" class="display table table-striped" cellspacing="0" width="100%">
            <thead>
                <tr>
                    <th>姓名</th>
                    <th>年龄</th>
                </tr>
            </thead>
        </table>
    </div>

    <script>
    $(document).ready(function() {
        var myData = [
            { "name": "<p>杰克</p>", "age": 29 },
            { "name": "<b><i>玛德琳夫人</i></b>", "age": 39 },
            { "name": "<h4 style='color:red'>永恒之焰</h4>", "age": 45 },
            { "name": "普通姓名无HTML", "age": 45 },
            { "name": "包含<b>内部</b>HTML的姓名", "age": 45 },
            { "name": "<!-- 这是一个注释 -->隐藏内容", "age": 50 },
            { "name": "<script>alert('危险脚本!');</script>潜在风险", "age": 55 }
        ];

        $('#example').DataTable({
            data: myData,
            columns: [
                {
                    data: "name",
                    render: function(data, type, row, meta) {
                        // 使用 $.parseHTML 解析数据,并用 <span> 包裹以确保结构完整
                        let node = $.parseHTML('<span>' + data + '</span>')[0];
                        // 返回解析后的纯文本内容
                        return node.innerText;
                    }
                },
                { data: "age" }
            ]
        });
    });
    </script>
</body>
</html>

在上述示例中,render函数会处理name列的数据。即使name字段包含p、b、h4或script等标签,最终显示在表格中的都将是这些标签内的纯文本内容。

注意事项

  • 安全性增强:这种方法能有效阻止恶意脚本的执行,因为innerText只会提取文本,而不会执行脚本。
  • HTML注释处理:对于HTML注释(如),innerText会忽略注释内部的内容,只显示注释外的文本。
  • 数据源净化:尽管此方法在客户端提供了保护,但最佳实践仍然是在数据源头(服务器端)对用户输入进行严格的净化和验证,以防止不安全的数据进入系统。

方法二:正则表达式快速去除HTML标签

如果你的需求仅仅是简单地去除所有HTML标签,并且对安全性要求不是极高(因为正则表达式可能无法完全覆盖所有复杂的HTML或恶意注入场景),可以使用正则表达式进行快速替换。DataTables自身在处理HTML类型列的排序时也采用了类似的方法。

智川X-Agent
智川X-Agent

中科闻歌推出的一站式AI智能体开发平台

下载

工作原理

使用JavaScript的String.prototype.replace()方法结合正则表达式/ <.>/g来匹配并移除所有HTML标签。

  • / <.>/g: 这是一个正则表达式。
    • <:>
    • .*?: 匹配任意字符(.)零次或多次(*),但尽可能少地匹配(?,非贪婪模式),直到遇到下一个模式。
    • >: 匹配结尾的右尖括号。
    • g: 全局匹配标志,确保替换所有匹配项。

示例代码

在DataTables的初始化中,修改name列的render函数:

$(document).ready(function() {
    var myData = [
        { "name": "<p>杰克</p>", "age": 29 },
        { "name": "<b><i>玛德琳夫人</i></b>", "age": 39 },
        { "name": "<h4 style='color:red'>永恒之焰</h4>", "age": 45 },
        { "name": "普通姓名无HTML", "age": 45 },
        { "name": "包含<b>内部</b>HTML的姓名", "age": 45 },
        { "name": "<script>alert('危险脚本!');</script>潜在风险", "age": 55 }
    ];

    $('#example').DataTable({
        data: myData,
        columns: [
            {
                data: "name",
                render: function(data, type, row, meta) {
                    // 使用正则表达式去除所有HTML标签
                    return data.replace(/<.*?>/g, '');
                }
            },
            { data: "age" }
        ]
    });
});

注意事项

  • 简便性:这种方法代码简洁,易于实现。
  • 局限性
    • 安全性较低:正则表达式在处理复杂或嵌套的HTML结构,以及防范所有XSS变体方面不如DOM解析器(如$.parseHTML)健壮。例如,它可能无法正确处理某些畸形的HTML或特殊编码的攻击。
    • 可能误删内容:如果数据中包含类似HTML标签的非HTML文本(例如作为XML数据的一部分),它也会被删除。
    • 不处理HTML实体:此方法只会删除标签,不会解码HTML实体(如<会被保留为<而不是

最佳实践与总结

在处理DataTables中包含HTML的数据时,选择合适的方法至关重要:

  1. 首选 $.parseHTML + innerText

    • 安全性高:能够有效防止XSS攻击,因为它只提取纯文本。
    • 鲁棒性好:基于DOM解析,对HTML结构的处理更为准确。
    • 推荐场景:当你需要从富文本中提取纯文本进行显示,并且数据可能包含用户输入时。
  2. 谨慎使用正则表达式

    • 适用于简单场景:如果数据源可信,且HTML结构简单,仅需快速去除标签,可以考虑。
    • 不作为主要安全措施:不应将其作为防范XSS攻击的主要手段。
  3. 源头净化是关键

    • 无论客户端采取何种措施,最根本且最安全的做法是在数据进入系统时(通常在服务器端)就对其进行严格的净化和验证。移除或转义所有潜在的恶意HTML和脚本标签,确保存储和传输的数据是安全的。

通过合理运用DataTables的columns.render功能,结合jQuery提供的强大工具或简单的正则表达式,开发者可以有效地控制DataTables中数据的渲染方式,提升用户体验,并增强应用程序的安全性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
jquery插件有哪些
jquery插件有哪些

jquery插件有jQuery UI、jQuery Validate、jQuery DataTables、jQuery Slick、jQuery LazyLoad、jQuery Countdown、jQuery Lightbox、jQuery FullCalendar、jQuery Chosen和jQuery EasyUI等。本专题为大家提供jquery插件相关的文章、下载、课程内容,供大家免费下载体验。

156

2023.09.12

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

334

2023.10.13

jquery删除元素的方法
jquery删除元素的方法

jquery可以通过.remove() 方法、 .detach() 方法、.empty() 方法、.unwrap() 方法、.replaceWith() 方法、.html('') 方法和.hide() 方法来删除元素。更多关于jquery相关的问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

406

2023.11.10

jQuery hover()方法的使用
jQuery hover()方法的使用

hover()是jQuery中一个常用的方法,它用于绑定两个事件处理函数,这两个函数将在鼠标指针进入和离开匹配的元素时执行。想了解更多hover()的相关内容,可以阅读本专题下面的文章。

515

2023.12.04

jquery实现分页方法
jquery实现分页方法

在jQuery中实现分页可以使用插件或者自定义实现。想了解更多jquery分页的相关内容,可以阅读本专题下面的文章。

312

2023.12.06

jquery中隐藏元素是什么
jquery中隐藏元素是什么

jquery中隐藏元素是非常重要的一个概念,在使用jquery隐藏元素之前,需要先了解css样式中关于元素隐藏的属性,比如display、visibility、opacity等属性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

128

2024.02.23

jquery中什么是高亮显示
jquery中什么是高亮显示

jquery中高亮显示是指对页面搜索关键词时进行高亮显示,其实现办法:1、先获取要高亮显示的行,获取搜索的内容,再遍历整行内容,最后添加高亮颜色;2、使用“jquery highlight”高亮插件。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

183

2024.02.23

jQuery 正则表达式相关教程
jQuery 正则表达式相关教程

本专题整合了jQuery正则表达式相关教程大全,阅读专题下面的文章了解更多详细内容。

51

2026.01.13

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Sass 教程
Sass 教程

共14课时 | 0.9万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

CSS教程
CSS教程

共754课时 | 42.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号