0

0

在Django应用中高效导入Excel数据到模型表:完整教程

霞舞

霞舞

发布时间:2025-11-29 12:16:52

|

899人浏览过

|

来源于php中文网

原创

在Django应用中高效导入Excel数据到模型表:完整教程

本教程详细介绍了如何在django项目中实现excel文件数据批量导入到模型表的功能。我们将利用`openpyxl`库解析上传的excel文件,并通过django视图逐行读取数据并创建对应的模型实例,从而简化大量数据的录入过程。

引言

在企业级应用开发中,批量导入数据是常见的需求,尤其是在需要初始化大量数据或定期更新数据时。手动录入数据效率低下且容易出错,而通过导入Excel文件可以大大提高工作效率。本教程将指导您如何在Django框架中,利用openpyxl库实现将Excel数据高效导入到数据库模型表的功能。

1. 环境准备

首先,您需要安装openpyxl库,它是Python中用于读写Excel .xlsx 文件的强大工具。

pip install openpyxl

2. Django模型定义

为了演示数据导入,我们使用一个简单的Product模型来存储计算机信息。请确保您的models.py中包含以下模型定义:

# your_app_name/models.py

from django.db import models
from django.utils import timezone

class Product(models.Model):
    model = models.CharField(max_length=50, null=True, verbose_name="型号")
    serial = models.CharField(max_length=50, null=True, unique=True, verbose_name="序列号") # 建议序列号唯一
    hd_size = models.CharField(max_length=50, null=True, verbose_name="硬盘大小")
    ram = models.CharField(max_length=50, null=True, verbose_name="内存")
    processor = models.CharField(max_length=50, null=True, verbose_name="处理器")
    date_created = models.DateTimeField(default=timezone.now, verbose_name="创建日期")
    date_updated = models.DateTimeField(auto_now=True, verbose_name="更新日期")

    class Meta:
        verbose_name = "产品"
        verbose_name_plural = "产品列表"

    def __str__(self):
        return f"{self.serial} - {self.model}"

注意: 为了数据完整性,我们建议将serial字段设置为unique=True。如果Excel文件中存在重复的序列号,导入时可能会导致错误或需要额外的冲突处理逻辑。

3. 前端文件上传界面

我们需要一个HTML表单来允许用户上传Excel文件。创建一个名为 import_product.html 的模板文件。

<!-- your_app_name/templates/import_product.html -->

<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>导入产品数据</title>
    <style>
        body { font-family: sans-serif; background-color: #333; color: whitesmoke; }
        .container { max-width: 600px; margin: 50px auto; padding: 20px; border-radius: 8px; background-color: #444; }
        form { display: flex; flex-direction: column; gap: 15px; }
        input[type="file"] { padding: 10px; border: 1px solid #555; border-radius: 4px; background-color: #666; color: whitesmoke; }
        button { padding: 10px 15px; background-color: #007bff; color: white; border: none; border-radius: 4px; cursor: pointer; font-size: 16px; }
        button:hover { background-color: #0056b3; }
        .go-back-btn { margin-top: 20px; background-color: #6c757d; }
        .go-back-btn:hover { background-color: #5a6268; }
    </style>
</head>
<body>
    <div class="container">
        <p style="font-size:20px;">
            选择一个包含您要导入的产品数据的Excel文件
        </p>
        <form method="post" enctype="multipart/form-data">
            {% csrf_token %}
            <input type="file" name="excel_file" accept=".xlsx, .xls">
            <button type="submit">导入</button>
        </form>

        <div class="container-fluid">
            <button class="go-back-btn" onclick="goBack()">返回</button>
        </div>
    </div>

    <script>
        function goBack() {
            window.history.back();
        }
    </script>
</body>
</html>

关键点:

  • enctype="multipart/form-data":这是上传文件所必需的编码类型。
  • {% csrf_token %}:Django的安全机制,用于防止跨站请求伪造攻击。
  • name="excel_file":这是后端视图中通过request.FILES访问文件时使用的名称。
  • accept=".xlsx, .xls":限制文件选择器只显示Excel文件。

4. 后端数据处理逻辑

接下来,在您的views.py中创建处理文件上传和数据导入的视图函数。

Amazon Nova
Amazon Nova

亚马逊云科技(AWS)推出的一系列生成式AI基础模型

下载
# your_app_name/views.py

import openpyxl
from django.shortcuts import render, redirect
from django.contrib.auth.decorators import login_required
from .models import Product # 导入您的Product模型

@login_required
def import_product(request):
    """
    处理Excel文件上传并导入产品数据到数据库。
    """
    if request.method == 'POST':
        if 'excel_file' in request.FILES:
            excel_file = request.FILES['excel_file']

            # 检查文件类型,确保是Excel文件
            if not excel_file.name.endswith(('.xlsx', '.xls')):
                # 可以添加错误消息到前端
                return render(request, 'import_product.html', {'error_message': '请上传有效的Excel文件 (.xlsx 或 .xls)。'})

            try:
                wb = openpyxl.load_workbook(excel_file)
                ws = wb.active # 获取活动工作表

                # 存储要创建的Product对象列表
                products_to_create = []

                # 遍历工作表中的每一行,从第二行开始 (跳过标题行)
                # values_only=True 表示只获取单元格的值,而不是单元格对象
                for row_num, row in enumerate(ws.iter_rows(min_row=2, values_only=True), start=2):
                    # 确保行数据长度与模型字段匹配
                    if len(row) < 5: # model, serial, hd_size, ram, processor
                        # 记录错误或跳过此行
                        print(f"警告: 第 {row_num} 行数据不完整,已跳过: {row}")
                        continue

                    # 解包行数据到对应的变量
                    # 确保Excel列的顺序与这里解包的变量顺序一致
                    model_val, serial_val, hd_size_val, ram_val, processor_val = row[:5]

                    # 简单的非空验证
                    if not all([model_val, serial_val, hd_size_val, ram_val, processor_val]):
                        print(f"警告: 第 {row_num} 行存在空值,已跳过: {row}")
                        continue

                    # 创建Product对象,但不立即保存
                    product = Product(
                        model=str(model_val).strip() if model_val is not None else '',
                        serial=str(serial_val).strip() if serial_val is not None else '',
                        hd_size=str(hd_size_val).strip() if hd_size_val is not None else '',
                        ram=str(ram_val).strip() if ram_val is not None else '',
                        processor=str(processor_val).strip() if processor_val is not None else '',
                    )
                    products_to_create.append(product)

                # 使用 bulk_create 批量创建对象,提高性能
                Product.objects.bulk_create(products_to_create, ignore_conflicts=True) # ignore_conflicts=True 忽略重复的serial

                return redirect('import_success_2') # 导入成功后重定向到成功页面

            except Exception as e:
                # 捕获处理Excel文件或数据库操作中的任何异常
                print(f"导入过程中发生错误: {e}")
                return render(request, 'import_product.html', {'error_message': f'导入失败: {e}'})
        else:
            return render(request, 'import_product.html', {'error_message': '请选择一个文件进行上传。'})

    return render(request, 'import_product.html')

@login_required
def import_success_2(request):
    """
    导入成功后的显示页面。
    """
    return render(request, 'your_app_name/import_success_2.html') # 确保路径正确

代码解析:

  • @login_required:确保只有登录用户才能访问此视图。
  • request.method == 'POST':处理表单提交。
  • request.FILES['excel_file']:获取上传的文件对象,excel_file是前端input标签的name属性值。
  • openpyxl.load_workbook(excel_file):加载Excel工作簿。
  • wb.active:获取当前活动的工作表。
  • ws.iter_rows(min_row=2, values_only=True):这是一个关键点。
    • min_row=2:跳过Excel文件的第一行(通常是标题行)。
    • values_only=True:只返回单元格的值,而不是完整的单元格对象,简化了数据处理。
  • model_val, serial_val, ... = row[:5]:将每一行的数据解包到对应的变量。请确保Excel文件中列的顺序与模型字段的顺序严格匹配。 [:5]是为了防止Excel中可能存在的空列导致解包错误。
  • Product.objects.bulk_create(products_to_create, ignore_conflicts=True):
    • bulk_create是Django提供的一种高效批量创建对象的方法,它通过一次数据库查询插入所有对象,而不是为每个对象执行一次查询,显著提高了性能。
    • ignore_conflicts=True:当遇到唯一性约束冲突(如serial字段重复)时,会忽略该条记录而不是抛出错误,这在某些场景下很有用。
  • return redirect('import_success_2'):导入成功后重定向到另一个页面,避免用户刷新页面导致重复提交。

5. 导入成功页面

创建一个简单的 import_success_2.html 模板,用于显示导入成功的消息。

<!-- your_app_name/templates/your_app_name/import_success_2.html -->

<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>导入成功</title>
    <style>
        body { font-family: sans-serif; background-color: #333; color: whitesmoke; text-align: center; }
        .container { max-width: 600px; margin: 50px auto; padding: 20px; border-radius: 8px; background-color: #444; }
        h1 { color: #28a745; }
        button { padding: 10px 15px; background-color: #007bff; color: white; border: none; border-radius: 4px; cursor: pointer; font-size: 16px; margin-top: 20px; }
        button:hover { background-color: #0056b3; }
    </style>
</head>
<body>
    <div class="container">
        <h1>数据导入成功!</h1>
        <p>您的Excel文件已成功导入到数据库中。</p>
        <button onclick="window.location.href='/'">返回首页</button> <!-- 或其他页面 -->
    </div>
</body>
</html>

6. URL配置

最后,您需要在项目的urls.py中配置相应的URL路由,将URL模式映射到视图函数。

# your_project_name/urls.py 或 your_app_name/urls.py

from django.contrib import admin
from django.urls import path
from your_app_name import views # 假设您的应用名为 your_app_name

urlpatterns = [
    path('admin/', admin.site.urls),
    path('import/product/', views.import_product, name='import_product'),
    path('import/success/', views.import_success_2, name='import_success_2'),
    # ... 其他URL配置
]

7. 进阶考量与最佳实践

7.1 数据验证

在将数据保存到数据库之前,进行严格的数据验证至关重要。

  • 字段类型验证: 确保Excel中的数据类型与模型字段的预期类型匹配(例如,数字字段不能包含文本)。
  • 业务逻辑验证: 例如,序列号是否已存在(虽然unique=True和ignore_conflicts=True可以处理,但提前告知用户更好)、日期格式是否正确等。
  • 自定义表单验证: 可以创建一个临时的forms.Form或forms.ModelForm来利用Django的表单验证机制对每一行数据进行验证。
# your_app_name/forms.py
from django import forms
from .models import Product

class ProductImportForm(forms.ModelForm):
    class Meta:
        model = Product
        fields = ['model', 'serial', 'hd_size', 'ram', 'processor']

    def clean_serial(self):
        serial = self.cleaned_data['serial']
        if Product.objects.filter(serial=serial).exists():
            raise forms.ValidationError(f"序列号 '{serial}' 已存在。")
        return serial

# 在 views.py 中使用
# ...
# for row_num, row in enumerate(ws.iter_rows(min_row=2, values_only=True), start=2):
#     # ... 解包数据
#     data = {
#         'model': model_val, 'serial': serial_val, 'hd_size': hd_size_val,
#         'ram': ram_val, 'processor': processor_val
#     }
#     form = ProductImportForm(data)
#     if form.is_valid():
#         product = form.save(commit=False) # 不立即保存
#         products_to_create.append(product)
#     else:
#         # 处理验证失败的行,例如记录错误或返回给用户
#         print(f"第 {row_num} 行数据验证失败: {form.errors}")
# ...

7.2 错误处理与用户反馈

  • 详细错误信息: 当导入失败时,向用户提供具体的错误信息,例如“第5行序列号重复”或“文件格式不正确”。
  • 进度显示: 对于大型文件,可以考虑使用JavaScript在前端显示导入进度,或使用Celery等异步任务队列在后台处理导入,并通过WebSocket通知用户。
  • 事务管理: 使用django.db.transaction.atomic()确保所有导入操作要么全部成功,要么全部回滚,保持数据一致性。
# 在 views.py 中使用事务
from django.db import transaction

# ...
# @login_required
# def import_product(request):
#     # ...
#     if request.method == 'POST':
#         # ...
#         try:
#             with transaction.atomic(): # 确保所有操作在一个事务中
#                 # ... openpyxl 加载和遍历
#                 # ... products_to_create 列表填充
#                 Product.objects.bulk_create(products_to_create, ignore_conflicts=True)
#             return redirect('import_success_2')
#         except Exception as e:
#             # 事务失败会自动回滚
#             print(f"导入过程中发生错误: {e}")
#             return render(request, 'import_product.html', {'error_message': f'导入失败: {e}'})
#     # ...

7.3 性能优化

  • bulk_create: 如教程所示,这是批量插入数据的最佳实践。
  • 异步处理: 对于非常大的Excel文件(例如几十万行),直接在HTTP请求中处理可能会导致超时。建议使用异步任务队列(如Celery)在后台处理导入任务,并将结果通知用户。

总结

通过本教程,您应该已经掌握了在Django项目中实现Excel文件批量导入到模型表的基本方法。我们利用openpyxl库解析Excel文件,结合Django视图和模型操作,实现了高效的数据录入。同时,我们也探讨了数据验证、错误处理、事务管理和性能优化等进阶主题,帮助您构建更加健壮和用户友好的导入功能。在实际项目中,请根据您的具体需求和数据规模,选择最适合的实现策略。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python Web 框架 Django 深度开发
Python Web 框架 Django 深度开发

本专题系统讲解 Python Django 框架的核心功能与进阶开发技巧,包括 Django 项目结构、数据库模型与迁移、视图与模板渲染、表单与认证管理、RESTful API 开发、Django 中间件与缓存优化、部署与性能调优。通过实战案例,帮助学习者掌握 使用 Django 快速构建功能全面的 Web 应用与全栈开发能力。

167

2026.02.04

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

338

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

225

2025.10.31

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

138

2026.02.12

点击input框没有光标怎么办
点击input框没有光标怎么办

点击input框没有光标的解决办法:1、确认输入框焦点;2、清除浏览器缓存;3、更新浏览器;4、使用JavaScript;5、检查硬件设备;6、检查输入框属性;7、调试JavaScript代码;8、检查页面其他元素;9、考虑浏览器兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

197

2023.11.24

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

390

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2112

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

359

2023.08.31

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6.1万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.5万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号