0

0

PHP中如何将CSV字符串转为数组?str_getcsv函数使用方法

蓮花仙者

蓮花仙者

发布时间:2025-08-26 13:03:01

|

957人浏览过

|

来源于php中文网

原创

最直接可靠的方法是使用str_getcsv()函数,它能正确处理分隔符、引号和转义字符,适用于解析内存中的CSV字符串。

php中如何将csv字符串转为数组?str_getcsv函数使用方法

在PHP中,将CSV格式的字符串转换成数组,最直接、最可靠的方法就是使用内置的

str_getcsv()
函数。它专门为此设计,能够很好地处理CSV格式的复杂性,比如包含逗号或引号的数据字段。

PHP提供了一个非常方便的内置函数

str_getcsv()
来完成这项任务。这个函数能够智能地解析CSV字符串,考虑到分隔符、引用符和转义符,并将其内容转换为一个数组。它的基本语法是
str_getcsv(string $input, string $delimiter = ',', string $enclosure = '"', string $escape = '\')

让我们看几个例子,从最简单的到稍微复杂一点的。

基本用法:

立即学习PHP免费学习笔记(深入)”;

<?php
$csvString = "Apple,Banana,Orange";
$dataArray = str_getcsv($csvString);
print_r($dataArray);
// 输出: Array ( [0] => Apple [1] => Banana [2] => Orange )
?>

自定义分隔符:

如果你的CSV字符串不是以逗号分隔,比如用分号,你可以这样指定:

<?php
$csvString = "ID;Name;Email";
$dataArray = str_getcsv($csvString, ';');
print_r($dataArray);
// 输出: Array ( [0] => ID [1] => Name [2] => Email )
?>

处理包含分隔符的数据(引用符):

CSV标准允许使用引号(通常是双引号)来包围包含分隔符的字段。

str_getcsv()
会自动处理这种情况。

<?php
$csvString = '"Product A","Description, with a comma","Price $10.99"';
$dataArray = str_getcsv($csvString);
print_r($dataArray);
// 输出: Array ( [0] => Product A [1] => Description, with a comma [2] => Price $10.99 )
?>

这里,

"Description, with a comma"
即使包含了逗号,也会被正确地识别为一个独立的字段,因为它是被双引号包围的。

处理引用符本身:

如果一个字段中需要包含引用符,通常的做法是将其重复一次(即

""
),或者用转义字符。
str_getcsv()
默认处理
""
的情况。

<?php
$csvString = '"Field with ""quotes"" inside",Another Field';
$dataArray = str_getcsv($csvString);
print_r($dataArray);
// 输出: Array ( [0] => Field with "quotes" inside [1] => Another Field )
?>

如果你的CSV使用了反斜杠

 作为转义字符,你也可以指定它:

<?php
$csvString = 'Field with "quotes" inside,Another Field';
$dataArray = str_getcsv($csvString, ',', '"', '\');
print_r($dataArray);
// 输出: Array ( [0] => Field with "quotes" inside [1] => Another Field )
?>

不过,通常情况下,CSV标准更倾向于双引号转义双引号的方式。

str_getcsv 函数与 explode 或 fgetcsv 有何区别?

在PHP中处理CSV数据,我们确实有几种不同的方法,但它们各自有其适用场景和优缺点。理解

str_getcsv
explode
fgetcsv
之间的区别,对于选择最合适的工具至关重要。

首先说

explode
explode()
函数是最基础的字符串分割函数,它只是简单地根据你指定的分隔符将字符串切分成数组。它的优点是速度快,代码简洁,但缺点也同样明显:它对CSV格式的复杂性一无所知。这意味着,如果你的CSV字段中包含分隔符(例如,一个描述字段里有逗号),或者字段被引号包围(例如
"Hello, World"
),
explode
会错误地将它们分割开来,导致数据解析错误。它无法处理引用、转义字符这些CSV的核心特性。所以,
explode
几乎不适合处理任何稍微复杂一点的CSV数据,除非你确定你的CSV字符串极其简单,没有引号,没有字段内分隔符。

<?php
$csvString = "Apple,Banana,"Orange, Sweet"";
$explodedArray = explode(',', $csvString);
print_r($explodedArray);
// 输出: Array ( [0] => Apple [1] => Banana [2] => "Orange [3] => Sweet" ) - 明显错误
?>

接下来是

fgetcsv
fgetcsv()
函数是专门用来从文件指针(例如通过
fopen()
打开的文件)中读取一行CSV数据并将其解析为数组的。它的功能与
str_getcsv()
非常相似,同样能够正确处理分隔符、引用符和转义字符。
fgetcsv
的主要优势在于它面向文件流,这意味着在处理大型CSV文件时,它能逐行读取,而不需要一次性将整个文件加载到内存中,这大大节省了内存资源,提升了处理效率。如果你需要处理的是一个CSV文件,而不是一个已经加载到内存中的CSV字符串,那么
fgetcsv
通常是首选。它内部也是调用了与
str_getcsv
类似的解析逻辑。

<?php
// 假设有一个名为 'data.csv' 的文件,内容是:
// Apple,Banana,"Orange, Sweet"
// Carrot,Potato,"Tomato, Red"

// $handle = fopen('data.csv', 'r');
// if ($handle) {
//     while (($data = fgetcsv($handle)) !== FALSE) {
//         print_r($data);
//     }
//     fclose($handle);
// }
// 输出:
// Array ( [0] => Apple [1] => Banana [2] => Orange, Sweet )
// Array ( [0] => Carrot [1] => Potato [2] => Tomato, Red )
?>

(这里因为我们是生成文章,无法直接执行文件操作,所以用注释表示其用法和预期输出。)

CreateWise AI
CreateWise AI

为播客创作者设计的AI创作工具,AI自动去口癖、提交亮点和生成Show notes、标题等

下载

最后是

str_getcsv
。正如我们前面讨论的,
str_getcsv()
是用来解析已经存在于内存中的CSV字符串的。它继承了
fgetcsv
的强大解析能力,可以正确处理各种CSV格式的细节,如带引号的字段、字段内的分隔符和转义字符。它的优势在于灵活性,当你从数据库、API响应或用户输入中获取到CSV格式的字符串时,
str_getcsv
是最直接、最便捷的解决方案,无需先将字符串写入文件再读取。它就是为了解决“字符串转数组”这个特定问题而生的。

总结来说:

  • explode
    : 适用于最简单的、无任何CSV特殊格式的字符串分割。
  • fgetcsv
    : 适用于从CSV文件中逐行读取和解析数据,处理大文件时内存效率高。
  • str_getcsv
    : 适用于处理内存中已有的CSV字符串,功能强大,能正确解析各种CSV格式。

选择哪个函数,完全取决于你的数据来源和具体需求。如果你有一个CSV文件,用

fgetcsv
;如果你已经有一个CSV字符串,用
str_getcsv
;如果你的字符串格式简单到不能再简单,且你追求极致的速度(尽管这种速度差异在大多数情况下可以忽略),并且你确定不会有任何CSV的复杂性,那
explode
勉强能用,但风险很高。

处理复杂CSV字符串:如何应对特殊字符和空值?

在实际应用中,CSV数据远不止“逗号分隔”那么简单,我们经常会遇到各种“奇葩”情况,比如字段内包含逗号、双引号,或者出现空值,甚至整行都是空的。

str_getcsv()
在设计之初就考虑到了这些,但我们仍然需要了解它的行为模式,以便更好地处理这些复杂场景。

1. 字段内包含逗号或双引号: 这是CSV标准的核心问题之一。当一个字段本身包含分隔符(如逗号)或引用符(如双引号)时,该字段必须用双引号包围起来。如果字段内本身有双引号,则该双引号需要被“转义”,通常的做法是将其重复一次(即

""
)。
str_getcsv()
能够很好地处理这两种情况。

<?php
$complexCsv = '"Item A","Description with a comma, and ""quotes"" inside",123';
$data = str_getcsv($complexCsv);
print_r($data);
// 输出: Array ( [0] => Item A [1] => Description with a comma, and "quotes" inside [2] => 123 )
?>

可以看到,

"Description with a comma, and ""quotes"" inside"
被正确解析成
Description with a comma, and "quotes" inside
str_getcsv()
默认的
enclosure
"
escape
,这与标准的CSV行为非常匹配。如果你遇到非标准的转义方式(比如使用 
 转义 
"
),你需要在函数调用时明确指定
escape
参数。

2. 处理空值或缺失字段: CSV中空值通常表现为两个分隔符之间没有任何内容,或者一个被引号包围的空字符串

""
str_getcsv()
会将这些识别为空字符串。

<?php
$csvWithEmpty = "Value1,,Value3,""";
$data = str_getcsv($csvWithEmpty);
print_r($data);
// 输出: Array ( [0] => Value1 [1] => [2] => Value3 [3] => )
?>

这里,第二个字段

,,
被解析为空字符串,第四个字段
""
也被解析为空字符串。这符合预期,因为在数据处理中,空字符串通常用来表示缺失或空值。后续你可以根据业务逻辑,将这些空字符串进一步处理成
null
或其他默认值。

3. 处理整行空行: 如果你的CSV字符串包含一个完全空白的行(例如,只有换行符),

str_getcsv()
会返回一个包含单个空字符串的数组,或者在某些PHP版本和特定情况下,返回
false
。这需要你在处理多行CSV时特别注意。

<?php
$multiLineCsv = "Header1,Header2
Value1,Value2

Value3,Value4";
$lines = explode("
", $multiLineCsv);
foreach ($lines as $line) {
    if (trim($line) === '') { // 检查是否是空行
        echo "Skipping empty line.
";
        continue;
    }
    $data = str_getcsv($line);
    print_r($data);
}
// 输出:
// Array ( [0] => Header1 [1] => Header2 )
// Array ( [0] => Value1 [1] => Value2 )
// Skipping empty line.
// Array ( [0] => Value3 [1] => Value4 )
?>

这里我用

explode("
", $multiLineCsv)
将多行CSV字符串分割成单行,然后在循环中对每行进行
str_getcsv
处理。在处理之前,通过
trim($line) === ''
检查并跳过完全空白的行是一个好的实践,可以避免解析无意义的空数组。

4. 字符编码问题: 虽然

str_getcsv()
本身不直接处理字符编码转换,但如果你的CSV字符串编码与PHP脚本的内部编码不一致,可能会导致乱码。例如,如果CSV是GBK编码,而你的PHP脚本默认处理UTF-8,那么解析出来的中文字符就会是乱码。在这种情况下,你需要在调用
str_getcsv()
之前,使用
iconv()
mb_convert_encoding()
等函数将CSV字符串转换成正确的编码。

<?php
// 假设 $gbkCsvString 是GBK编码的CSV字符串
// $utf8CsvString = iconv('GBK', 'UTF-8//IGNORE', $gbkCsvString);
// $data = str_getcsv($utf8CsvString);
// print_r($data);
?>

//IGNORE
选项可以忽略无法转换的字符,防止转换失败。

处理复杂CSV字符串的关键在于理解CSV的格式规范,以及

str_getcsv()
如何解释这些规范。通过适当地配置
delimiter
enclosure
escape
参数,并结合一些预处理(如编码转换、空行跳过),我们就能有效地应对各种复杂的CSV数据。

str_getcsv 函数的性能考量及替代方案?

在使用

str_getcsv()
函数时,性能确实是一个值得考虑的方面,尤其是在处理非常大的CSV字符串时。虽然它在功能上非常强大和方便,但由于其设计初衷是解析内存中的字符串,它在某些特定场景下可能会遇到瓶颈。

性能考量:

  1. 内存占用
    str_getcsv()
    需要将整个CSV字符串加载到内存中进行处理。如果你的CSV字符串非常巨大(比如几十MB甚至上GB),这会导致PHP脚本消耗大量内存,甚至可能超出
    memory_limit
    限制,导致脚本崩溃。
  2. CPU开销: 尽管
    str_getcsv()
    是用C语言实现的PHP内置函数,效率很高,但解析CSV格式本身就是一项相对复杂的任务,需要处理引号、转义字符、分隔符等逻辑。对于极长的单行CSV字符串,解析过程仍然会消耗显著的CPU时间。
  3. 多行处理:
    str_getcsv()
    每次只能处理一行CSV字符串。如果你有一个包含多行的CSV字符串,你需要先将其分割成单行(通常使用
    explode("
    ", $csvString)
    ),然后循环对每一行调用
    str_getcsv()
    。这种组合操作会增加额外的函数调用开销,并且
    explode
    本身也需要一次性处理整个字符串。

何时

str_getcsv()
是最佳选择?

  • CSV字符串较小: 当你的CSV字符串大小在几KB到几MB之间时,
    str_getcsv()
    的性能通常是完全可以接受的,而且它的便利性远超其他手动解析方法。
  • 数据源是字符串: 如果你的CSV数据直接来源于数据库字段、API响应、或者用户在文本框中输入的内容,这些都是内存中的字符串,
    str_getcsv()
    是最直接且正确的工具。
  • 单行CSV数据: 如果你只需要解析单行CSV数据,
    str_getcsv()
    是最简洁高效的方式。

替代方案:

str_getcsv()
遇到性能瓶颈,特别是内存问题时,我们需要考虑其他方案。

  1. fgetcsv()
    用于文件流处理: 这是最常见且最推荐的替代方案,尤其是在处理大型CSV文件时。如前所述,
    fgetcsv()
    从文件指针中逐行读取数据。这意味着它每次只加载一行到内存中进行解析,极大地降低了内存消耗。即使文件大小达到GB级别,只要你的处理逻辑是逐行进行的,
    fgetcsv()
    也能高效地完成任务。

    <?php
    // 假设 'large_data.csv' 是一个非常大的CSV文件
    // $handle = fopen('large_data.csv', 'r');
    // if ($handle) {
    //     while (($data = fgetcsv($handle)) !== FALSE) {
    //         // 处理每一行数据,例如:
    //         // print_r($data);
    //         // database_insert($data);
    //     }
    //     fclose($handle);
    // } else {
    //     echo "无法打开文件!";
    // }
    ?>

    如果你有一个非常大的CSV字符串,但又不能直接保存到文件,你可以考虑使用

    php://memory
    php://temp
    流包装器,将字符串“写入”到内存或临时文件流中,然后用
    fgetcsv()
    从这个流中读取。这本质上是模拟了文件操作,但仍然可以利用
    fgetcsv()
    的逐行读取优势。

    <?php
    $largeCsvString = "Header1,Header2
    " . str_repeat("ValueA,ValueB
    ", 100000); // 模拟一个大字符串
    $stream = fopen('php://temp', 'r+'); // 使用php://temp,当数据量大时会写入临时文件
    fwrite($stream, $largeCsvString);
    rewind($stream); // 将文件指针重置到开头
    
    $parsedData = [];
    while (($row = fgetcsv($stream)) !== FALSE) {
        $parsedData[] = $row;
        // 如果数据量巨大,不要将所有行都存入 $parsedData,而是逐行处理或写入数据库
    }
    fclose($stream);
    // print_r($parsedData); // 此时 $parsedData 可能仍然很大,取决于原始字符串大小
    ?>

    这种

    php://temp
    的方式,有效地将“处理大字符串”的问题转换成了“处理大文件流”的问题,从而规避了
    str_getcsv
    一次性加载整个字符串的内存压力。

  2. 手动解析(不推荐,除非有特殊需求): 在极少数情况下,如果

    str_getcsv()
    fgetcsv()
    的行为无法满足你非常特殊的CSV变体(比如非标准的转义或引用规则),你可能需要编写自己的解析器。但这通常是一个非常复杂且容易出错的任务,需要处理各种边界情况,并且性能往往不如内置函数。除非你对CSV解析有深入的理解,并有充分的测试,否则强烈不建议采取这种方式。内置函数已经过高度优化和充分测试,能覆盖绝大多数CSV标准。

总结来说,对于CSV字符串到数组的转换,

str_getcsv()
是首选。但当数据量巨大到可能引发内存问题时,应立即考虑将数据作为文件流处理,并使用
fgetcsv()
,或者通过
php://temp
等流包装器将大字符串转换为流进行处理,以优化性能和内存使用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C语言变量命名
C语言变量命名

c语言变量名规则是:1、变量名以英文字母开头;2、变量名中的字母是区分大小写的;3、变量名不能是关键字;4、变量名中不能包含空格、标点符号和类型说明符。php中文网还提供c语言变量的相关下载、相关课程等内容,供大家免费下载使用。

410

2023.06.20

c语言入门自学零基础
c语言入门自学零基础

C语言是当代人学习及生活中的必备基础知识,应用十分广泛,本专题为大家c语言入门自学零基础的相关文章,以及相关课程,感兴趣的朋友千万不要错过了。

638

2023.07.25

c语言运算符的优先级顺序
c语言运算符的优先级顺序

c语言运算符的优先级顺序是括号运算符 > 一元运算符 > 算术运算符 > 移位运算符 > 关系运算符 > 位运算符 > 逻辑运算符 > 赋值运算符 > 逗号运算符。本专题为大家提供c语言运算符相关的各种文章、以及下载和课程。

362

2023.08.02

c语言数据结构
c语言数据结构

数据结构是指将数据按照一定的方式组织和存储的方法。它是计算机科学中的重要概念,用来描述和解决实际问题中的数据组织和处理问题。数据结构可以分为线性结构和非线性结构。线性结构包括数组、链表、堆栈和队列等,而非线性结构包括树和图等。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

263

2023.08.09

c语言random函数用法
c语言random函数用法

c语言random函数用法:1、random.random,随机生成(0,1)之间的浮点数;2、random.randint,随机生成在范围之内的整数,两个参数分别表示上限和下限;3、random.randrange,在指定范围内,按指定基数递增的集合中获得一个随机数;4、random.choice,从序列中随机抽选一个数;5、random.shuffle,随机排序。

631

2023.09.05

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

564

2023.09.20

c语言get函数的用法
c语言get函数的用法

get函数是一个用于从输入流中获取字符的函数。可以从键盘、文件或其他输入设备中读取字符,并将其存储在指定的变量中。本文介绍了get函数的用法以及一些相关的注意事项。希望这篇文章能够帮助你更好地理解和使用get函数 。

671

2023.09.20

c数组初始化的方法
c数组初始化的方法

c语言数组初始化的方法有直接赋值法、不完全初始化法、省略数组长度法和二维数组初始化法。详细介绍:1、直接赋值法,这种方法可以直接将数组的值进行初始化;2、不完全初始化法,。这种方法可以在一定程度上节省内存空间;3、省略数组长度法,这种方法可以让编译器自动计算数组的长度;4、二维数组初始化法等等。

618

2023.09.22

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.5万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号