0

0

CSV 文件处理基准测试:Golang、NestJS、PHP、Python

WBOY

WBOY

发布时间:2024-08-13 09:45:18

|

511人浏览过

|

来源于dev.to

转载

介绍

高效处理大型 csv 文件是许多应用程序中的常见要求,从数据分析到 etl(提取、转换、加载)过程。在本文中,我想对四种流行编程语言(golang、带有 nestjs 的 nodejs、php 和 python)在 macbook pro m1 上处理大型 csv 文件的性能进行基准测试。我的目标是确定哪种语言可以为该任务提供最佳性能。

测试环境

硬件:macbook pro m1,256gb ssd,8gb ram

软件:

  • macos 索诺玛 14.5
  • php 8.3.6
  • golang 1.22.4
  • node.js 22.0.0 与 nestjs
  • python 3.12.3

测试数据

我使用了一个名为 sales_data.csv 的合成 csv 文件,其中包含大约 100 万行,每行包含交易详细信息,例如 transaction_id、product_id、数量、价格和时间戳。

任务描述

对于每种语言,脚本执行以下任务:

立即学习PHP免费学习笔记(深入)”;

  1. 读取 csv 文件。
  2. 计算总销售额。
  3. 识别销量最高的产品。

执行

以下是每种语言使用的脚本:

go 语言脚本:

销售.go

package main

import (
    "encoding/csv"
    "fmt"
    "os"
    "strconv"
    "time"
)

func main() {
    start := time.now()

    file, err := os.open("../generate-csv/sales_data.csv")
    if err != nil {
        fmt.println("error:", err)
        return
    }
    defer file.close()

    reader := csv.newreader(file)
    _, _ = reader.read() // skip header

    totalsales := 0.0
    productsales := make(map[string]float64)

    for {
        line, err := reader.read()
        if err != nil {
            break
        }
        productid := line[1]
        quantity, _ := strconv.atoi(line[2])
        price, _ := strconv.parsefloat(line[3], 64)
        total := float64(quantity) * price

        totalsales += total
        productsales[productid] += total
    }

    var topproduct string
    var topsales float64
    for product, sales := range productsales {
        if sales > topsales {
            topproduct = product
            topsales = sales
        }
    }

    elapsed := time.since(start)
    fmt.printf("golang execution time: %s\n", elapsed)
    fmt.printf("total sales: $%.2f\n", totalsales)
    fmt.printf("top product: %s with sales $%.2f\n", topproduct, topsales)
}

nestjs脚本:

csv.service.ts

import { injectable } from '@nestjs/common';
import * as fs from 'fs';
import * as fastcsv from 'fast-csv';

// path file csv
const global_csv_path = '../generate-csv/sales_data.csv';

@injectable()
@injectable()
export class csvservice {
  async parsecsv(): promise<{
    nestexecutiontime: number;
    totalsales: number;
    topproductsales: number;
  }> {
    return new promise((resolve, reject) => {
      const starttime = process.hrtime();

      let totalsales = 0;
      const productsales: { [key: string]: number } = {};

      fs.createreadstream(global_csv_path)
        .pipe(fastcsv.parse({ headers: true, delimiter: ',' }))
        .on('data', (row) => {
          const productid = row.product_id;
          const quantity = parseint(row.quantity, 10);
          const price = parsefloat(row.price);
          const total = quantity * price;
          totalsales += total;
          if (!productsales[productid]) {
            productsales[productid] = 0;
          }
          productsales[productid] += total;
        })
        .on('end', () => {
          const topproduct = object.keys(productsales).reduce((a, b) =>
            productsales[a] > productsales[b] ? a : b,
          );
          const topproductsales = productsales[topproduct] || 0;
          const endtime = process.hrtime(starttime);
          const nestexecutiontime = endtime[0] + endtime[1] / 1e9;

          console.log(`nestjs execution time: ${nestexecutiontime} seconds`);
          console.log(`total sales: $${totalsales}`);
          console.log(
            `top product: ${topproduct} with sales $${topproductsales}`,
          );

          resolve({
            nestexecutiontime,
            totalsales,
            topproductsales,
          });
        })
        .on('error', (error) => reject(error));
    });
  }
}

csv.controller.ts

Favird No-Code Tools
Favird No-Code Tools

无代码工具的聚合器

下载
import { controller, get } from '@nestjs/common';
import { csvservice } from './csv.service';

@controller('csv')
export class csvcontroller {
  constructor(private readonly csvservice: csvservice) {}

  @get('parse')
  async parsecsv(): promise<{
    nestexecutiontime: number;
    totalsales: number;
    topproductsales: number;
  }> {
    return this.csvservice.parsecsv();
  }
}

php脚本

销售.php

<?php
$start_time = microtime(true);

$file = fopen("../generate-csv/sales_data.csv", "r");
$total_sales = 0;
$product_sales = [];

fgetcsv($file); // skip header
while (($line = fgetcsv($file)) !== false) {
    $product_id = $line[1];
    $quantity = (int)$line[2];
    $price = (float)$line[3];
    $total = $quantity * $price;

    $total_sales += $total;
    if (!isset($product_sales[$product_id])) {
        $product_sales[$product_id] = 0;
    }
    $product_sales[$product_id] += $total;
}
fclose($file);

arsort($product_sales);
$top_product = array_key_first($product_sales);

$end_time = microtime(true);
$execution_time = ($end_time - $start_time);

echo "php execution time: ".$execution_time." seconds\n";
echo "total sales: $".$total_sales."\n";
echo "top product: ".$top_product." with sales $".$product_sales[$top_product]."\n";

python脚本

import csv
import time

# Input file name config
input_file = '../generate-csv/sales_data.csv'


def parse_csv(file_path):
    start_time = time.time()

    total_sales = 0
    product_sales = {}

    with open(file_path, mode='r') as file:
        reader = csv.DictReader(file)

        for row in reader:
            product_id = row['product_id']
            quantity = int(row['quantity'])
            price = float(row['price'])
            total = quantity * price
            total_sales += total

            if product_id not in product_sales:
                product_sales[product_id] = 0
            product_sales[product_id] += total

    top_product = max(product_sales, key=product_sales.get)
    execution_time = time.time() - start_time

    return {
        'total_sales': total_sales,
        'top_product': top_product,
        'top_product_sales': product_sales[top_product],
        'execution_time': execution_time,
    }


if __name__ == "__main__":
    result = parse_csv(input_file)
    print(f"Python Execution time: {result['execution_time']:.2f} seconds")
    print(f"Total Sales: ${result['total_sales']:.2f}")
    print(f"Top Product: {result['top_product']} with sales ${
          result['top_product_sales']:.2f}")

结果

以下是我们基准测试的结果:

戈兰

  • 执行时间:466.69975ms
  • 总销售额:$274654985.36
  • 顶级产品:产品 1126,销售额 $305922.81

CSV 文件处理基准测试:Golang、NestJS、PHP、Python

nestjs

  • 执行时间:6.730134208秒
  • 总销售额:$274654985.36000216
  • 顶级产品:1126,销售额 $305922.8099999997

CSV 文件处理基准测试:Golang、NestJS、PHP、Python

php

  • 执行时间:1.5142710208893秒
  • 总销售额:$274654985.36
  • 顶级产品:1126 销售额 $305922.81

CSV 文件处理基准测试:Golang、NestJS、PHP、Python

python

  • 执行时间:2.56秒
  • 总销售额:$274654985.36
  • 顶级产品:1126 销售额 $305922.81

CSV 文件处理基准测试:Golang、NestJS、PHP、Python

分析

我的基准测试揭示了一些有趣的见解:

执行时间:golang 在执行时间方面表现最好,php8 紧随其后,而 nestjs 完成任务的时间最长。
内存使用:build nestjs 表现出高效的内存使用,而 python 表现出更高的内存消耗。
易于实现:golang 提供了最简单的实现,而 nestjs 需要更多的代码行和复杂性。

结论

根据我的发现,golang 提供了最佳的性能速度和内存效率,使其成为处理大型数据集的绝佳选择。

完整代码

您可以在我的 github 存储库上获取完整代码
csv-解析-战斗.

相关文章

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

210

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

247

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

356

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

214

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

409

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

490

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

201

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

1458

2025.06.17

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
快速入门Node.JS全套完整版
快速入门Node.JS全套完整版

共83课时 | 9.1万人学习

nodejs开发基础教程
nodejs开发基础教程

共15课时 | 4.6万人学习

JavaScript设计模式视频教程
JavaScript设计模式视频教程

共28课时 | 5.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号