0

0

提取字符串中特定格式的数值(如价格和序列号)的完整教程

聖光之護

聖光之護

发布时间:2026-01-27 14:30:02

|

799人浏览过

|

来源于php中文网

原创

提取字符串中特定格式的数值(如价格和序列号)的完整教程

本文介绍如何从非结构化文本中精准提取带逗号的价格(如 `15,000`)和纯数字序列号(如 `02604800000734987654`),重点解决 `is_numeric()` 对含逗号数字失效的问题,并提供基于 `str_replace` 的稳健方案与正则表达式两种专业级实现方法。

在实际开发中,我们常需从日志、票据或OCR识别后的杂乱文本中提取关键字段(如金额、单号、日期等)。但原始字符串缺乏固定分隔符或标准结构,直接使用 explode() + is_numeric() 往往失败——因为 PHP 的 is_numeric("15,000") 返回 false:它仅识别整数、浮点数及科学计数法格式,不支持千位分隔符(,)

✅ 推荐方案一:预处理 + 分词过滤(简洁可靠)

该方法逻辑清晰、易调试、容错性强,适合字段位置相对稳定、数量较少的场景:

$string = "hdahdsa jkasdhjsa USD 15,000 jshads hduasdo SN : 02604800000734987654 at  17/02/2022 18:04:47. Blabla bla bla sdsad dsada ";

// 按空格分割,逐词处理
$words = preg_split('/\s+/', trim($string), -1, PREG_SPLIT_NO_EMPTY);
$matches = [];

foreach ($words as $word) {
    // 移除逗号后判断是否为纯数字(支持 "15,000"、"026048...")
    $clean = str_replace(',', '', $word);
    if (ctype_digit($clean) && strlen($clean) >= 8) { // 序列号通常较长,加长度过滤更安全
        $matches[] = $word;
    } elseif (ctype_digit($clean) && strpos($word, ',') !== false) { // 明确含逗号 → 视为价格
        $matches[] = $word;
    }
}

// 按业务逻辑分配变量(假设价格总在序列号之前)
$price = $matches[0] ?? null;
$sn    = $matches[1] ?? null;

echo "Price: $price\n"; // 输出: Price: 15,000
echo "SN: $sn\n";       // 输出: SN: 02604800000734987654
⚠️ 注意:ctype_digit() 比 is_numeric() 更严格(仅接受纯数字字符串),避免误匹配 1e5 或 -123 等非预期值;配合 strpos($word, ',') 可明确区分价格与长序列号。

✅ 推荐方案二:正则表达式精准捕获(高精度、可扩展)

当文本模式较固定(如 "USD " 后紧跟 "SN : "),正则表达式是最佳选择,语义明确且性能优秀:

MOKI
MOKI

MOKI是美图推出的一款AI短片创作工具,旨在通过AI技术自动生成分镜图并转为视频素材。

下载
$string = "hdahdsa jkasdhjsa USD 15,000 jshads hduasdo SN : 02604800000734987654 at  17/02/2022 18:04:47. Blabla bla bla sdsad dsada ";

// 匹配:USD 后的带逗号数字(价格) + SN : 后的连续数字(序列号)
if (preg_match('/USD\s+([0-9,]+).*?SN\s*:\s*([0-9]+)/s', $string, $matches)) {
    $price = $matches[1]; // "15,000"
    $sn    = $matches[2]; // "02604800000734987654"

    echo "Price: $price\n";
    echo "SN: $sn\n";
} else {
    echo "Failed to extract required fields.\n";
}
  • /s 修饰符使 . 可匹配换行符,增强鲁棒性;
  • .*? 是非贪婪匹配,确保准确捕获两个目标间最短内容;
  • 括号 () 形成捕获组,$matches[1] 和 $matches[2] 即对应价格与序列号。

? 总结与选型建议

方案 适用场景 优点 风险提示
预处理 + 分词 字段位置不严格、需兼容多种变体(如 USD, EUR, SN:, Serial No:) 逻辑透明、易于添加业务规则(如长度校验、前缀判断) 需注意空格/标点干扰,建议用 preg_split('/\s+/', ...) 替代 explode()
正则捕获 文本结构相对稳定、需高精度定位 一行匹配、性能好、可复用性强 正则编写需谨慎,过度宽松(如 .*)易导致误匹配,建议用 .*? 并锚定关键词

无论采用哪种方式,切勿直接依赖 is_numeric() 处理含格式符号的数字。始终先清洗(去逗号、空格等),再验证;关键业务字段务必增加存在性检查(?? null 或 isset()),避免未定义变量错误。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
php文件怎么打开
php文件怎么打开

打开php文件步骤:1、选择文本编辑器;2、在选择的文本编辑器中,创建一个新的文件,并将其保存为.php文件;3、在创建的PHP文件中,编写PHP代码;4、要在本地计算机上运行PHP文件,需要设置一个服务器环境;5、安装服务器环境后,需要将PHP文件放入服务器目录中;6、一旦将PHP文件放入服务器目录中,就可以通过浏览器来运行它。

2916

2023.09.01

php怎么取出数组的前几个元素
php怎么取出数组的前几个元素

取出php数组的前几个元素的方法有使用array_slice()函数、使用array_splice()函数、使用循环遍历、使用array_slice()函数和array_values()函数等。本专题为大家提供php数组相关的文章、下载、课程内容,供大家免费下载体验。

1740

2023.10.11

php反序列化失败怎么办
php反序列化失败怎么办

php反序列化失败的解决办法检查序列化数据。检查类定义、检查错误日志、更新PHP版本和应用安全措施等。本专题为大家提供php反序列化相关的文章、下载、课程内容,供大家免费下载体验。

1568

2023.10.11

php怎么连接mssql数据库
php怎么连接mssql数据库

连接方法:1、通过mssql_系列函数;2、通过sqlsrv_系列函数;3、通过odbc方式连接;4、通过PDO方式;5、通过COM方式连接。想了解php怎么连接mssql数据库的详细内容,可以访问下面的文章。

1120

2023.10.23

php连接mssql数据库的方法
php连接mssql数据库的方法

php连接mssql数据库的方法有使用PHP的MSSQL扩展、使用PDO等。想了解更多php连接mssql数据库相关内容,可以阅读本专题下面的文章。

1566

2023.10.23

html怎么上传
html怎么上传

html通过使用HTML表单、JavaScript和PHP上传。更多关于html的问题详细请看本专题下面的文章。php中文网欢迎大家前来学习。

1297

2023.11.03

PHP出现乱码怎么解决
PHP出现乱码怎么解决

PHP出现乱码可以通过修改PHP文件头部的字符编码设置、检查PHP文件的编码格式、检查数据库连接设置和检查HTML页面的字符编码设置来解决。更多关于php乱码的问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1689

2023.11.09

php文件怎么在手机上打开
php文件怎么在手机上打开

php文件在手机上打开需要在手机上搭建一个能够运行php的服务器环境,并将php文件上传到服务器上。再在手机上的浏览器中输入服务器的IP地址或域名,加上php文件的路径,即可打开php文件并查看其内容。更多关于php相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1310

2023.11.13

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

6

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 9.7万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号