0

0

利用Python Dominate实现Excel数据驱动的HTML文件批量创建

聖光之護

聖光之護

发布时间:2025-11-28 10:47:02

|

196人浏览过

|

来源于php中文网

原创

利用Python Dominate实现Excel数据驱动的HTML文件批量创建

本教程旨在指导如何使用python及其dominate库,自动化地从excel数据生成独立的html文件。文章将详细介绍如何通过编程方式构建html结构,并结合模拟的excel数据,实现每行数据对应一个html文件的批量创建,从而简化静态网站内容的管理与生成流程。

在现代Web开发中,尤其是在构建大量结构相似但内容不同的静态页面时,手动创建和填充HTML文件效率低下且易出错。当数据源是结构化的表格(如Excel文件)时,这种重复性工作更应通过自动化工具来解决。Python因其强大的数据处理能力和丰富的库生态系统,成为实现这一目标的理想选择。本教程将重点介绍如何利用Python的dominate库,结合Excel数据(或任何结构化数据),批量生成定制化的HTML文件。

1. 理解自动化生成HTML的需求

假设我们有一个Excel文件,其中包含多行数据,例如“图片”、“姓名”、“描述”和“代表作”等字段,目标是为Excel中的每一行数据生成一个独立的HTML文件。每个HTML文件都应包含一个预设的HTML结构,并用对应行的数据填充其中的占位符。例如,对于古典作曲家的数据,我们希望生成一个页面,展示其肖像、姓名、简介和代表作品。

2. Python与HTML生成:Dominate库简介

dominate是一个强大的Python库,它允许开发者直接在Python代码中以编程方式创建HTML文档和片段。与传统的字符串拼接或模板引擎(如Jinja2)不同,dominate通过提供一系列Python对象来代表HTML标签,使得HTML结构的构建更加直观、类型安全且易于维护。它将HTML元素视为Python对象,并通过上下文管理器(with语句)来表达嵌套关系,极大地提高了代码的可读性。

2.1 安装 Dominate

首先,确保您的Python环境中安装了dominate库。如果尚未安装,可以使用pip进行安装:

立即学习Python免费学习笔记(深入)”;

pip install dominate

2.2 Dominate基础用法示例

以下是一个简单的dominate示例,展示了如何创建一个基本的HTML文档结构:

Peppertype.ai
Peppertype.ai

高质量AI内容生成软件,它通过使用机器学习来理解用户的需求。

下载
import dominate
from dominate.tags import *

# 创建一个HTML文档对象,并设置标题
doc = dominate.document(title='我的第一个Dominate页面')

# 在文档头部添加样式表和脚本文件
with doc.head:
    link(rel='stylesheet', href='style.css')
    script(type='text/javascript', src='script.js')
    # 也可以直接嵌入CSS样式
    style("""
        body { font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; margin: 20px; background-color: #f0f2f5; color: #333; }
        h1 { color: #0056b3; }
        p { line-height: 1.5; }
    """)

# 在文档主体添加内容
with doc.body:
    with div(id='header'):
        h1('欢迎使用Dominate')
        p('这是一个通过Python Dominate生成的示例页面。')

    with div(cls='content'):
        p('您可以在这里添加更多动态内容。')
        ul():
            li('项目1')
            li('项目2')
            li('项目3')

# 打印生成的HTML字符串
print(doc)

运行上述代码将输出一个完整的HTML字符串,其中包含了我们通过Python代码定义的头部、样式和主体内容。

3. 数据集成:从Excel到HTML

要实现从Excel数据批量生成HTML文件,我们需要两个核心步骤:

  1. 读取Excel数据: 虽然dominate本身不处理Excel文件,但Python生态中有许多优秀的库可以完成此任务,例如pandas或openpyxl。在本教程中,我们将使用一个模拟的Python列表字典来代表已从Excel读取的数据,以简化演示。
  2. 遍历数据并生成HTML: 对每一行数据,调用一个函数来构建HTML文档,并将数据动态插入到相应的HTML元素中。

3.1 模拟Excel数据

为了演示,我们假设已经从Excel文件中读取了以下作曲家数据:

# 假设这是从Excel读取的数据,每项代表一行
excel_data = [
    {'Picture': 'beethoven.jpg', 'Name': 'Ludwig van Beethoven', 'Description': '德国作曲家和钢琴家,古典主义时期最重要的音乐家之一。', 'Piece': '第九交响曲'},
    {'Picture': 'mozart.jpg', 'Name': 'Wolfgang Amadeus Mozart', 'Description': '奥地利作曲家,欧洲古典主义音乐的代表人物。', 'Piece': '安魂曲'},
    {'Picture': 'bach.jpg', 'Name': 'Johann Sebastian Bach', 'Description': '德国作曲家,巴洛克时期音乐的集大成者。', 'Piece': '勃兰登堡协奏曲'}
]

3.2 完整实现示例:批量生成作曲家页面

下面的代码将展示如何结合dominate和模拟的Excel数据,为每位作曲家生成一个独立的HTML详情页。

import dominate
from dominate.tags import *
import os # 用于文件系统操作

# 模拟的Excel数据
excel_data = [
    {'Picture': 'beethoven.jpg', 'Name': 'Ludwig van Beethoven', 'Description': '德国作曲家和钢琴家,古典主义时期最重要的音乐家之一。', 'Piece': '第九交响曲'},
    {'Picture': 'mozart.jpg', 'Name': 'Wolfgang Amadeus Mozart', 'Description': '奥地利作曲家,欧洲古典主义音乐的代表人物。', 'Piece': '安魂曲'},
    {'Picture': 'bach.jpg', 'Name': 'Johann Sebastian Bach', 'Description': '德国作曲家,巴洛克时期音乐的集大成者。', 'Piece': '勃兰登堡协奏曲'}
]

# 定义一个函数,用于为单个作曲家创建HTML页面
def create_composer_page(composer_info):
    """
    根据作曲家信息字典生成一个HTML文档对象。
    """
    doc = dominate.document(title=f'{composer_info["Name"]} - 经典作曲家')

    with doc.head:
        meta(charset='utf-8')
        link(rel='stylesheet', href='../style.css') # 假设style.css在父目录
        # 嵌入一些基本样式,方便演示
        style("""
            body { font-family: Arial, sans-serif; line-height: 1.6; margin: 20px; background-color: #f4f4f4; color: #333; }
            .container { max-width: 800px; margin: auto; background: #fff; padding: 30px; border-radius: 8px; box-shadow: 0 2px 5px rgba(0,0,0,0.1); }
            h1 { color: #0056b3; border-bottom: 2px solid #eee; padding-bottom: 10px; margin-bottom: 20px; }
            img { max-width: 100%; height: auto; border-radius: 4px; margin-bottom: 15px; display: block; margin-left: auto; margin-right: auto; }
            p { margin-bottom: 10px; }
            .label { font-weight: bold; color: #555; }
            .button { display: inline-block; background-color: #007bff; color: white; padding: 10px 15px; border-radius: 5px; text-decoration: none; margin-top: 20px; }
            .button:hover { background-color: #0056b3; }
        """)

    with doc.body:
        with div(cls='container'):
            h1(composer_info['Name'])
            # 假设图片文件位于 'images/' 目录下
            img(src=f'../images/{composer_info["Picture"]}', alt=composer_info['Name'])
            p(span('描述:', cls='label'), composer_info['Description'])
            p(span('代表作:', cls='label'), composer_info['Piece'])
            a('返回作曲家列表', href='../index.html', cls='button')

    return doc

# 定义输出目录和图片目录
output_dir = 'generated_pages'
images_dir = 'images'
if not os.path.exists(output_dir):
    os.makedirs(output_dir)
if not os.path.exists(images_dir):
    os.makedirs(images_dir)
    print(f"请将图片文件(如 beethoven.jpg, mozart.jpg, bach.jpg)放入 '{images_dir}' 目录中。")


# 批量生成HTML文件
print("开始生成作曲家页面...")
for composer in excel_data:
    html_doc = create_composer_page(composer)
    # 使用作曲家名字作为文件名,并进行URL友好处理
    # 例如:"Ludwig van Beethoven" -> "ludwig_van_beethoven.html"
    filename = f"{composer['Name'].replace(' ', '_').lower()}.html"
    filepath = os.path.join(output_dir, filename)

    with open(filepath, 'w', encoding='utf-8') as f:
        f.write(str(html_doc))
    print(f"已生成文件: {filepath}")

# 生成一个主页 (index.html) 用于导航
index_doc = dominate.document(title='经典作曲家列表')
with index_doc.head:
    meta(charset='utf-8')
    link(rel='stylesheet', href='style.css')
    style("""
        body { font-family: Arial, sans-serif; line-height: 1.6; margin: 20px; background-color: #f4f4f4; color: #333; }
        .container { max-width: 800px; margin: auto; background: #fff; padding: 30px; border-radius: 8px; box-shadow: 0 2px 5px rgba(0,0,0,0.1); }
        h1 { color: #0056b3; border-bottom: 2px solid #eee; padding-bottom: 10px; margin-bottom: 20px; }
        ul { list-style: none; padding: 0; }
        li { margin-bottom: 10px; }
        li a { text-decoration: none; color: #007bff; font-weight: bold; }
        li a:hover { text-decoration: underline; color: #0056b3; }
    """)
with index_doc.body:
    with div(cls='container'):
        h1('经典作曲家列表')
        ul():
            for composer in excel_data:
                # 链接到生成的详情页
                li(a(composer['Name'], href=f"{output_dir}/{composer['Name'].replace(' ', '_').lower()}.html"))

index_filepath = 'index.html'
with open(index_filepath, 'w', encoding='utf-8') as f:
    f.write(str(index_doc))
print(f"已生成主页: {index_filepath}")

# 生成一个全局的style.css文件
style_content = """
    body { font-family: Arial, sans-serif; line-height: 1.6; margin: 20px; background-color: #f4f4f4; color: #333; }
    .container { max-width: 800px; margin: auto; background: #fff; padding: 30px; border-radius: 8px; box-shadow: 0 2px 5px rgba(0,0,0,0.1); }
    h1 { color: #0056b3; border-bottom: 2px solid #eee; padding-bottom: 10px; margin-bottom: 20px; }
    img { max-width: 100%; height: auto; border-radius: 4px; margin-bottom: 15px; display: block; margin-left: auto; margin-right: auto; }
    p { margin-bottom: 10px; }
    .label { font-weight: bold; color: #555; }
    .button { display: inline-block; background-color: #007bff; color: white; padding: 10px 15px; border-radius: 5px; text-decoration: none; margin-top: 20px; }
    .button:hover { background-color: #0056b3; }
"""
with open('style.css', 'w', encoding='utf-8') as f:
    f.write(style_content)
print("已生成全局样式文件: style.css")

print("\n所有文件生成完毕!")
print(f"请在浏览器中打开 '{index_filepath}' 查看结果。")
print(f"别忘了将图片文件(如 beethoven.jpg 等)放入 '{images_dir}' 目录。")

代码说明:

  1. 数据源模拟: excel_data列表模拟了从Excel读取的每一行数据。
  2. create_composer_page函数: 这个函数接收一个作曲家信息的字典,然后利用dominate库构建一个完整的HTML文档。
    • dominate.document(title=...) 创建文档。
    • with doc.head: 和 with doc.body: 用于在文档的头部和主体中添加内容。

相关文章

驱动精灵
驱动精灵

驱动精灵基于驱动之家十余年的专业数据积累,驱动支持度高,已经为数亿用户解决了各种电脑驱动问题、系统故障,是目前有效的驱动软件,有需要的小伙伴快来保存下载体验吧!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

81

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

34

2026.01.31

pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

437

2024.12.20

pip设置清华源
pip设置清华源

设置方法:1、打开终端或命令提示符窗口;2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件;3、打开pip.conf文件,然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容,这将把pip的镜像源设置为清华大学的镜像源;4、保存并关闭文件即可。

803

2024.12.23

python升级pip
python升级pip

本专题整合了python升级pip相关教程,阅读下面的文章了解更多详细内容。

371

2025.07.23

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Sass 教程
Sass 教程

共14课时 | 0.9万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

CSS教程
CSS教程

共754课时 | 43.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号