如何使用正则表达式在 PHP 中精准提取营养成分数据的类别、数值与单位

心靈之曲

发布时间：2026-01-29 10:31:01

935人浏览过

来源于php中文网

原创

如何使用正则表达式在 PHP 中精准提取营养成分数据的类别、数值与单位

本文介绍如何通过 `preg_match_all` 配合命名捕获组正则，从多行营养标签文本中准确分离出成分名称（如 "total lipid (fat)"）、浮点数值（如 22.163422468932）和单位（如 "g"），避免错误切分标点与空格。

直接使用 preg_split 按数字或空格分割容易破坏语义完整性——例如将 "Total lipid (fat)" 错误拆成 ["Total", "lipid", "(fat)"]，且难以保留数值与单位的边界。更可靠的做法是匹配（match）而非分割（split）：用正则主动识别每行中“非数字开头的类别名 + 空格 + 浮点数 + 空格 + 单位”的结构，并通过命名捕获组提取三部分。

推荐正则模式如下：

$pattern = '~^(?P\D+)\s+(?P[\d.]+)\s+(?P.+)~m';

^ 和 m 修饰符：使 ^ 匹配每一行开头（多行模式）；
(?Pgory>\D+)：捕获一个或多个非数字字符（\D），完美兼容含空格、逗号、括号的成分名（如 "Sugars, total" 或 "Sodium, Na"）；
\s+：匹配一个或多个空白符（含空格、制表符），作为分隔；
(?P[\d.]+)：捕获由数字和小数点组成的数值（注意：未限定小数点个数，适用于科学记数法外的常规浮点格式；若需更严格校验，可改为 (?P\d+(?:\.\d+)?)）；
(?P.+)：捕获剩余所有字符作为单位（如 "kcal"、"mg"），自动包含末尾换行前的内容。

完整 PHP 示例代码：

\D+)\s+(?P[\d.]+)\s+(?P.+)~m';
preg_match_all($pattern, $content, $matches, PREG_SET_ORDER);

// 输出结构化结果
foreach ($matches as $match) {
    echo sprintf(
        "[%s] => %s\n[%s] => %s\n[%s] => %s\n\n",
        'category', trim($match['category']),
        'value',    $match['value'],
        'unit',     trim($match['unit'])
    );
}
?>

✅ 输出效果示例（首行）：

Toolplay

一站式AI应用聚合生成平台

下载

立即学习“PHP免费学习笔记（深入）”；

[category] => Weight  
[value] => 229.6104534866  
[unit] => g

⚠️ 注意事项：

若输入中存在无单位行（如纯数值）或格式不一致（如缺失空格），该正则会跳过不匹配行——建议先用 trim() 清理每行首尾空白，并对 $matches[0] 进行空值检查；
如需支持国际单位中的逗号千位分隔符（如 "1,234.56"），应将 [\d.]+ 替换为更健壮的 [\d,]+(?:\.\d+)? 并预处理去除逗号；
preg_match_all 返回的 $matches 是二维数组，PREG_SET_ORDER 保证每个子数组对应一行完整匹配，键名为 category/value/unit，便于后续 JSON 序列化或数据库插入。

这种方法语义清晰、容错性强，是解析结构化标签文本的标准实践。

php怎么处理大数据量绘图表_php分页查数据绘散点图【技巧】

php获取本机ip与hostname关联吗_php通过hostname取ip【技巧】

php修改权限提示invalidargument_php参数非法修正【技巧】

php微信小程序数据缓存怎么弄_php配合缓存提升性能【技巧】

php判断字符串长度含零宽字符_php零宽字符处理法【步骤】

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php js json go 正则表达式 json 正则表达式数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 SQL 查询中正确组合必需条件与可选条件下一篇：如何将嵌套数组按值聚合并统计唯一键的数量

作者最新文章

Pinterest 裁员约 15%，探索采用开源 AI 模型降低开发成本

2026-01-29 16:12

如何用 Python 实现一个支持浮点结果的简易大小写敏感计算器

2026-01-29 16:20

Intel显卡战未来！官方确认：XeSS 3多帧生成下月支持B580

2026-01-29 16:25

猫眼电影如何添加电影收藏

2026-01-29 16:51

如何在 Jupyter Notebook 中正确导入自定义类

2026-01-29 16:53

恋小帮搜索话术怎么找

2026-01-29 16:57

如何在运行时通过全限定类名动态反序列化 JSON 并调用 save 方法

2026-01-29 16:59

脉脉怎么开会员-脉脉会员开通方法

2026-01-29 17:00

电脑端如何下载安装网易云音乐客户端

2026-01-29 17:07

美团外卖怎么用

2026-01-29 17:29

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

419

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

535

2023.08.23