0

0

Yii2中JSON数据批量导入MySQL的性能优化实践

心靈之曲

心靈之曲

发布时间:2025-11-06 12:18:39

|

247人浏览过

|

来源于php中文网

原创

Yii2中JSON数据批量导入MySQL的性能优化实践

本文深入探讨了在yii2框架下从json文件批量导入数据到mysql时遇到的性能瓶颈及优化策略。通过对比activerecord的save()方法与db命令的insert()及batchinsert(),并结合预加载关联数据,显著提升了导入效率。文章提供了详细的代码示例和注意事项,旨在帮助开发者高效处理大规模数据导入任务。

引言:理解批量数据导入的性能瓶颈

在Web应用开发中,尤其是在数据同步或初始化场景下,我们常需要将大量数据从文件(如JSON)导入到数据库。然而,如果不采用正确的策略,这一过程可能会非常耗时。原始代码中,开发者使用Yii2 ActiveRecord的save()方法在循环中逐条插入数据,导致了显著的性能下降。例如,导入数百条记录的时间会从几秒迅速增长到几十秒甚至更长,对于数万甚至百万级别的数据量,这种方法是不可接受的。

save()方法虽然方便,但它为每个模型实例执行了多项操作:实例化模型、数据验证、触发事件回调、以及最终执行一条独立的SQL INSERT 或 UPDATE 语句。当这些操作在循环中针对大量记录重复执行时,其累积的开销(包括PHP层面的处理和与数据库的多次往返通信)将成为严重的性能瓶颈。

考虑以下原始实现的核心逻辑:

foreach ($products as $product) {
    $item = new Product_dub();
    // ... 赋值属性 ...
    $category = Category_dub::findOne(['id_1c_category' => $product->category_id]); // 每次循环查询
    $brand = Brands_dub::findOne(['id_1c_brand' => $product->brand_id]); // 每次循环查询
    // ... 赋值关联ID ...
    if (!$item->save()) { // 每次循环执行一次INSERT
        // ... 错误处理 ...
    }
}

从上述代码可以看出,除了每次循环进行两次数据库查询来获取category和brand之外,最主要的性能消耗在于$item->save()。即使移除了findOne()查询,save()本身的开销依然巨大。

优化策略一:从ActiveRecord save() 到DB命令 insert()

解决save()性能问题的首要步骤是绕过ActiveRecord的全部生命周期,直接使用Yii2的数据库命令执行INSERT操作。Yii2的Yii::$app->db->createCommand()->insert()方法允许我们直接构建并执行SQL插入语句,极大地减少了框架层面的开销。

通过将$item->save()替换为insert()命令,性能得到了显著提升。例如,在测试中,1107行数据导入时间从最初的数分钟缩短到约40秒。

以下是使用insert()命令进行优化的示例:

foreach ($products as $product) {
    Yii::$app->db->createCommand()->insert('product_dub', [
        'id_1c_product' => $product->id,
        // ... 其他属性 ...
        'category_id' => $categoryMap[$product->category_id] ?? '0', // 假设categoryMap已预加载
        'brand_id' => $brandMap[$product->brand_id] ?? 'No brand',   // 假设brandMap已预加载
        // ...
    ])->execute();
}

这种方法虽然仍是循环中逐条插入,但每次循环仅执行一次SQL INSERT 命令,避免了ActiveRecord的验证、事件等额外处理,从而显著提高了效率。

网趣网上购物系统HTML静态版
网趣网上购物系统HTML静态版

网趣购物系统静态版支持网站一键静态生成,采用动态进度条模式生成静态,生成过程更加清晰明确,商品管理上增加淘宝数据包导入功能,与淘宝数据同步更新!采用领先的AJAX+XML相融技术,速度更快更高效!系统进行了大量的实用性更新,如优化核心算法、增加商品图片批量上传、谷歌地图浏览插入等,静态版独特的生成算法技术使静态生成过程可随意掌控,从而可以大大减轻服务器的负担,结合多种强大的SEO优化方式于一体,使

下载

优化策略二:预加载关联数据以减少查询次数

在原始代码中,Category_dub::findOne()和Brands_dub::findOne()在每次循环中都会执行一次数据库查询,以根据外部ID查找内部ID。对于N条记录,这将导致2N次额外的数据库查询,这就是典型的N+1查询问题,进一步拖慢了导入速度。

为了消除这些重复查询,我们应该在导入循环开始之前,一次性地从数据库中加载所有必要的关联数据,并将其存储在内存中的映射(Map)结构中。这样,在循环内部,我们只需进行内存查找,而非数据库查询。

以下是预加载分类和品牌数据的示例:

$categoryMap = Category_dub::find()->select(['id', 'id_1c_category'])->indexBy('id_1c_category')->column();
$brandMap = Brands_dub::find()->select(['id', 'id_1c_brand'])->indexBy('id_1c_brand')->column();

foreach ($products as $product) {
    Yii::$app->db->createCommand()->insert('product_dub', [
        'id_1c_product' => $product->id,
        'category_id' => $categoryMap[$product->category_id] ?? '0', // 从内存映射中获取
        'title' => $product->title,
        'brand_id' => $brandMap[$product->brand_id] ?? 'No brand',   // 从内存映射中获取
        'content1' => $product->content1,
        'content2' => $product->content2,
        'content3' => $product->content3,
        'link_order' => $product->link_order,
        'img' => $product->img ?? 'no-image.png',
        'in_stock' => $product->in_stock ? 1 : 0,
        'is_popular' => $product->is_popular ? 1 : 0,
    ])->execute();
}

通过结合insert()命令和预加载关联数据,我们可以看到一个完整的、大幅优化后的导入逻辑。

更进一步的性能提升:使用 batchInsert()

尽管insert()命令比save()快得多,但它仍然是循环中逐条执行SQL语句。对于处理数万甚至百万级别的数据,最佳实践是使用Yii2提供的batchInsert()方法。batchInsert()能够生成一条包含多行数据的INSERT SQL语句,一次性将多条记录发送到数据库,从而显著减少了与数据库的通信次数,进一步提升了性能。

batchInsert()方法的参数包括表名、列名数组和值数组(每个元素代表一行数据)。

public function importProductFile($file, $return = true)
{    
    $products = json_decode($file, true); // 解码为关联数组更方便
    $dubTableName = Product::tableName() . "_dub";
    $start = time();

    if ($this->db->createDuplicateTable(Product::tableName(), $dubTableName)) {
        $categoryMap = Category_dub::find()->select(['id', 'id_1c_category'])->indexBy('id_1c_category')->column();
        $brandMap = Brands_dub::find()->select(['id', 'id_1c_brand'])->indexBy('id_1c_brand')->column();

        $rows = [];
        foreach ($products as $product) {
            $rows[] = [
                'id_1c_product' => $product['id'],
                'category_id' => $categoryMap[$product['category_id']] ?? '0',
                'title' => $product['title'],
                'brand_id' => $brandMap[$product['brand_id']] ?? 'No brand',
                'content1' => $product['content1'],
                'content2' => $product['content2'],
                'content3' => $product['content3'],
                'link_order' => $product['link_order'],
                'img' => $product['img'] ?? 'no-image.png',
                'in_stock' => $product['in_stock'] ? 1 : 0,
                'is_popular' => $product['is_popular'] ? 1 : 0,
            ];
        }

        // 批量插入数据
        if (!empty($rows)) {
            Yii::$app->db->createCommand()->batchInsert('product_dub', array_keys($rows[0]), $rows)->execute();
        }
    }

    $finish = time();
    $res = $finish - $start . "sec. ";

    if ($return) {
        echo $res;
        Answer::success();
    }
}

高级优化与注意事项

除了上述代码层面的优化,还有一些其他因素可以影响批量导入

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
php文件怎么打开
php文件怎么打开

打开php文件步骤:1、选择文本编辑器;2、在选择的文本编辑器中,创建一个新的文件,并将其保存为.php文件;3、在创建的PHP文件中,编写PHP代码;4、要在本地计算机上运行PHP文件,需要设置一个服务器环境;5、安装服务器环境后,需要将PHP文件放入服务器目录中;6、一旦将PHP文件放入服务器目录中,就可以通过浏览器来运行它。

2894

2023.09.01

php怎么取出数组的前几个元素
php怎么取出数组的前几个元素

取出php数组的前几个元素的方法有使用array_slice()函数、使用array_splice()函数、使用循环遍历、使用array_slice()函数和array_values()函数等。本专题为大家提供php数组相关的文章、下载、课程内容,供大家免费下载体验。

1734

2023.10.11

php反序列化失败怎么办
php反序列化失败怎么办

php反序列化失败的解决办法检查序列化数据。检查类定义、检查错误日志、更新PHP版本和应用安全措施等。本专题为大家提供php反序列化相关的文章、下载、课程内容,供大家免费下载体验。

1566

2023.10.11

php怎么连接mssql数据库
php怎么连接mssql数据库

连接方法:1、通过mssql_系列函数;2、通过sqlsrv_系列函数;3、通过odbc方式连接;4、通过PDO方式;5、通过COM方式连接。想了解php怎么连接mssql数据库的详细内容,可以访问下面的文章。

1099

2023.10.23

php连接mssql数据库的方法
php连接mssql数据库的方法

php连接mssql数据库的方法有使用PHP的MSSQL扩展、使用PDO等。想了解更多php连接mssql数据库相关内容,可以阅读本专题下面的文章。

1546

2023.10.23

html怎么上传
html怎么上传

html通过使用HTML表单、JavaScript和PHP上传。更多关于html的问题详细请看本专题下面的文章。php中文网欢迎大家前来学习。

1277

2023.11.03

PHP出现乱码怎么解决
PHP出现乱码怎么解决

PHP出现乱码可以通过修改PHP文件头部的字符编码设置、检查PHP文件的编码格式、检查数据库连接设置和检查HTML页面的字符编码设置来解决。更多关于php乱码的问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1669

2023.11.09

php文件怎么在手机上打开
php文件怎么在手机上打开

php文件在手机上打开需要在手机上搭建一个能够运行php的服务器环境,并将php文件上传到服务器上。再在手机上的浏览器中输入服务器的IP地址或域名,加上php文件的路径,即可打开php文件并查看其内容。更多关于php相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1309

2023.11.13

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

8

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 1.9万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 811人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号