0

0

使用 Go 语言生成大尺寸 CSV 文件

心靈之曲

心靈之曲

发布时间:2025-10-04 11:11:50

|

306人浏览过

|

来源于php中文网

原创

使用 go 语言生成大尺寸 csv 文件

本文介绍了如何使用 Go 语言高效地生成一个指定大小的 CSV 文件,并通过示例代码演示了如何随机生成符合特定格式的数据行,并将其写入文件。该方法适用于需要模拟大数据场景,进行文件读写性能测试等应用。

生成大尺寸 CSV 文件

在进行文件读写性能测试,或者模拟大数据场景时,常常需要生成一个大尺寸的 CSV 文件。Go 语言凭借其高效的性能和简洁的语法,非常适合用于完成这项任务。

核心思路

  1. 定义数据格式: 明确 CSV 文件的每一行的数据格式,例如 prefix:username:timestamp, number。
  2. 随机生成数据: 使用 Go 语言的随机数生成器,生成符合数据格式的随机数据。
  3. 写入文件: 将生成的数据写入到文件中,直到文件达到指定的大小。
  4. 使用 bufio 优化写入: 使用 bufio 包的 Writer,可以显著提高文件写入的效率。

示例代码

以下是一个使用 Go 语言生成 10GB CSV 文件的示例代码:

package main

import (
    "bufio"
    "fmt"
    "math/rand"
    "os"
    "strconv"
    "time"
)

func main() {
    fileSize := int64(10e9) // 10GB
    filePath := "/tmp/largefile.csv" // 修改为实际路径
    f, err := os.Create(filePath)
    if err != nil {
        fmt.Println(err)
        return
    }
    defer f.Close()

    w := bufio.NewWriter(f)
    defer w.Flush()

    prefixes := []string{"login", "logout", "register"}
    names := []string{"jbill", "dkennedy"}
    timeStart := time.Date(2012, 1, 1, 0, 0, 0, 0, time.UTC)
    timeDur := timeStart.AddDate(1, 0, 0).Sub(timeStart)
    rand.Seed(time.Now().UnixNano())
    size := int64(0)

    for size < fileSize {
        prefix := prefixes[rand.Intn(len(prefixes))]
        name := names[rand.Intn(len(names))]
        timestamp := timeStart.Add(time.Duration(rand.Int63n(int64(timeDur)))).Format("2006/01/02")
        number := strconv.Itoa(rand.Intn(100) + 1)
        line := fmt.Sprintf("%s:%s:%s, %s\n", prefix, name, timestamp, number)

        n, err := w.WriteString(line)
        if err != nil {
            fmt.Println(n, err)
            return
        }
        size += int64(n)
    }

    fmt.Printf("Successfully created file: %s, Size: %d bytes\n", filePath, size)
}

代码解释:

科威旅游管理系统
科威旅游管理系统

该软件是以php+MySQL进行开发的旅游管理网站系统。系统前端采用可视化布局,能自动适应不同尺寸屏幕,一起建站,不同设备使用,免去兼容性烦恼。系统提供列表、表格、地图三种列表显示方式,让用户以最快的速度找到所需行程,大幅提高效率。系统可设置推荐、优惠行程,可将相应行程高亮显示,对重点行程有效推广,可实现网站盈利。系统支持中文、英文,您还可以在后台添加新的语言,关键字单独列出,在后台即可快速翻译。

下载
  • fileSize := int64(10e9): 定义目标文件大小为 10GB。
  • os.Create("/tmp/largefile"): 创建文件。请注意替换为实际的文件路径。
  • bufio.NewWriter(f): 创建一个带缓冲的 Writer,提高写入效率。
  • prefixes := []string{"login", "logout", "register"} 和 names := []string{"jbill", "dkennedy"}: 定义了前缀和用户名的数组,用于随机生成数据。
  • timeStart 和 timeDur: 定义了时间范围,用于随机生成时间戳。
  • rand.Seed(time.Now().UnixNano()): 使用当前时间作为随机数种子,确保每次运行生成的随机数不同。
  • 循环生成数据: 在循环中,随机选择前缀、用户名、时间戳和数字,并将它们组合成一行数据,然后写入文件。
  • w.Flush(): 将缓冲区中的数据写入文件。
  • f.Close(): 关闭文件。

编译和运行

将代码保存为 generate_csv.go,然后使用以下命令编译和运行:

go build generate_csv.go
./generate_csv

运行后,会在 /tmp/largefile.csv (或者你指定的路径) 生成一个 10GB 的 CSV 文件。

注意事项

  • 磁盘空间: 确保有足够的磁盘空间来存储生成的文件。
  • 文件路径: 请务必修改代码中的文件路径,指向你希望保存文件的位置。
  • 内存占用 虽然使用了 bufio 进行了缓冲,但生成超大文件时仍然需要注意内存占用。如果内存有限,可以考虑分批生成数据,并定期刷新缓冲区。
  • 错误处理: 代码中包含基本的错误处理,但可以根据实际需求进行更完善的错误处理。
  • 随机数种子: 使用 time.Now().UnixNano() 作为随机数种子,可以保证每次运行生成的随机数不同。 如果需要可重复的结果,可以使用固定的种子。

总结

使用 Go 语言生成大尺寸 CSV 文件是一种高效且灵活的方法。通过合理利用 bufio 包和随机数生成器,可以轻松地生成符合特定格式的大量数据,满足各种测试和模拟需求。 通过修改代码中的参数,可以生成不同大小和格式的 CSV 文件,以适应不同的应用场景。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

523

2023.08.02

AO3官网入口与中文阅读设置 AO3网页版使用与访问
AO3官网入口与中文阅读设置 AO3网页版使用与访问

本专题围绕 Archive of Our Own(AO3)官网入口展开,系统整理 AO3 最新可用官网地址、网页版访问方式、正确打开链接的方法,并详细讲解 AO3 中文界面设置、阅读语言切换及基础使用流程,帮助用户稳定访问 AO3 官网,高效完成中文阅读与作品浏览。

89

2026.02.02

主流快递单号查询入口 实时物流进度一站式追踪专题
主流快递单号查询入口 实时物流进度一站式追踪专题

本专题聚合极兔快递、京东快递、中通快递、圆通快递、韵达快递等主流物流平台的单号查询与运单追踪内容,重点解决单号查询、手机号查物流、官网入口直达、包裹进度实时追踪等高频问题,帮助用户快速获取最新物流状态,提升查件效率与使用体验。

24

2026.02.02

Golang WebAssembly(WASM)开发入门
Golang WebAssembly(WASM)开发入门

本专题系统讲解 Golang 在 WebAssembly(WASM)开发中的实践方法,涵盖 WASM 基础原理、Go 编译到 WASM 的流程、与 JavaScript 的交互方式、性能与体积优化,以及典型应用场景(如前端计算、跨平台模块)。帮助开发者掌握 Go 在新一代 Web 技术栈中的应用能力。

11

2026.02.02

PHP Swoole 高性能服务开发
PHP Swoole 高性能服务开发

本专题聚焦 PHP Swoole 扩展在高性能服务端开发中的应用,系统讲解协程模型、异步IO、TCP/HTTP/WebSocket服务器、进程与任务管理、常驻内存架构设计。通过实战案例,帮助开发者掌握 使用 PHP 构建高并发、低延迟服务端应用的工程化能力。

4

2026.02.02

Java JNI 与本地代码交互实战
Java JNI 与本地代码交互实战

本专题系统讲解 Java 通过 JNI 调用 C/C++ 本地代码的核心机制,涵盖 JNI 基本原理、数据类型映射、内存管理、异常处理、性能优化策略以及典型应用场景(如高性能计算、底层库封装)。通过实战示例,帮助开发者掌握 Java 与本地代码混合开发的完整流程。

5

2026.02.02

go语言 注释编码
go语言 注释编码

本专题整合了go语言注释、注释规范等等内容,阅读专题下面的文章了解更多详细内容。

62

2026.01.31

go语言 math包
go语言 math包

本专题整合了go语言math包相关内容,阅读专题下面的文章了解更多详细内容。

55

2026.01.31

go语言输入函数
go语言输入函数

本专题整合了go语言输入相关教程内容,阅读专题下面的文章了解更多详细内容。

27

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 4.5万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号