0

0

PostgreSQL 数组字符串的安全解析正则方案

霞舞

霞舞

发布时间:2026-02-24 08:40:02

|

299人浏览过

|

来源于php中文网

原创

PostgreSQL 数组字符串的安全解析正则方案

本文介绍如何用正则表达式安全地解析 PostgreSQL 一维数组的字符串表示(如 {"a,b","c",d}),将其标准化为 JSON 兼容格式,便于 Go 等不原生支持 PG 数组的 ORM 正确反序列化。

本文介绍如何用正则表达式安全地解析 postgresql 一维数组的字符串表示(如 `{"a,b","c",d}`),将其标准化为 json 兼容格式,便于 go 等不原生支持 pg 数组的 orm 正确反序列化。

PostgreSQL 在 text[] 类型字段以字符串形式返回数组时(例如通过 SELECT something FROM test),会采用一种特定的、非标准的文本格式:元素用双引号包裹(仅当含逗号、空格或引号等特殊字符时),并以花括号包围,元素间用英文逗号分隔。典型示例如下:

{"hello world","foo,bar",baz,"qu"oted"}

该格式不是 JSON,也不符合 CSV 规范(无转义机制说明),因此不能直接使用 json.Unmarshal 或 csv.NewReader 安全解析。尤其需注意:

  • 未加引号的元素(如 baz)可能包含空格但未被引号包裹;
  • 引号内允许出现转义双引号("),但 PostgreSQL 实际输出中默认不转义(除非显式使用 ARRAY_TO_STRING 配合自定义逻辑);
  • 原始问题明确假设「引号不会在值内出现」(即无嵌套引号),这是关键前提。

✅ 推荐正则预处理方案(Go 可用)

核心思路是:将所有数组元素统一包裹在双引号中,并确保逗号始终位于引号外作为分隔符,从而构造出类 JSON 的字符串(如 ["hello world","foo,bar","baz","qu"oted"]),再交由 json.Unmarshal 解析。

Lovable
Lovable

AI辅助编程工具

下载

以下正则表达式可在 Go 中用于插入缺失的引号(适用于 regexp.ReplaceAllString):

import "regexp"

// 匹配所有“位于元素边界处、且不在引号内的逗号”前后位置,
// 并在每个元素(无论是否已引号)两侧补上双引号(再统一去重)
const pgArrayPattern = `(?<=^{|,)([^",{}]+?)(?=,|$|})`

func parsePGArray(s string) ([]string, error) {
    // Step 1: 提取所有元素(支持带空格/逗号的未引号项)
    re := regexp.MustCompile(pgArrayPattern)
    matches := re.FindAllStringSubmatch([]byte(s), -1)

    // Step 2: 清洗每个匹配项:去除首尾空格,去掉已有引号(保留内部转义)
    var result []string
    for _, m := range matches {
        elem := strings.TrimSpace(string(m))
        // 去除首尾双引号(若存在),注意:不处理内部 " —— 因PG默认不输出转义
        if len(elem) >= 2 && elem[0] == '"' && elem[len(elem)-1] == '"' {
            elem = elem[1 : len(elem)-1]
        }
        result = append(result, elem)
    }

    return result, nil
}

为什么不用复杂断言正则?
原答案提供的 (?不被支持(Go 使用 RE2 引擎,禁用回溯与多数环视)。因此必须采用更稳健、RE2 兼容的提取式正则(如上 pgArrayPattern),它基于明确的边界锚点 ^{|, 和 ,|$|},可靠提取所有合法元素。

✅ 完整 Go 示例(含错误处理)

package main

import (
    "fmt"
    "regexp"
    "strings"
)

func ParsePGTextArray(s string) ([]string, error) {
    if !strings.HasPrefix(s, "{") || !strings.HasSuffix(s, "}") {
        return nil, fmt.Errorf("invalid PG array format: missing braces")
    }
    body := s[1 : len(s)-1] // 去掉 {}
    if body == "" {
        return []string{}, nil
    }

    // 匹配:以 { 或 , 开头,以 , 或 } 或结尾结束,中间是非 , { } " 的任意字符(惰性)
    re := regexp.MustCompile(`([^",{}]+)`)
    matches := re.FindAllString(body, -1)

    var res []string
    for _, m := range matches {
        e := strings.TrimSpace(m)
        if e == "" {
            continue
        }
        // 处理已引号包裹的元素:剥掉外层引号
        if len(e) >= 2 && e[0] == '"' && e[len(e)-1] == '"' {
            e = e[1 : len(e)-1]
        }
        res = append(res, e)
    }
    return res, nil
}

func main() {
    input := `{"bla, bla",bla,"bu bu",bu}`
    arr, err := ParsePGTextArray(input)
    if err != nil {
        panic(err)
    }
    fmt.Printf("%q
", arr) // ["bla, bla" "bla" "bu bu" "bu"]
}

⚠️ 重要注意事项

  • 仅限一维 text[]:本方案不处理嵌套数组(如 {{1,2},{3,4}})或非 text 类型(如 int[] 的数字解析需额外类型转换)。
  • 禁止引号内嵌套:PostgreSQL 默认输出中,text[] 元素若含双引号,会以 " 形式转义;但标准 array_to_string() 不生成此格式。如业务中存在手动拼接含 " 的场景,需先用 strings.ReplaceAll(s, "\"","`) 预处理。
  • 性能建议:对高频调用场景,可将 regexp.MustCompile 提升为包级变量,避免重复编译。
  • 更优替代方案:长期建议切换至支持原生数组的驱动(如 jackc/pgx),其 pgtype.TextArray 可自动完成安全解析,彻底规避正则风险。

通过上述方法,你可以在不修改数据库 schema 的前提下,稳健地桥接 PostgreSQL 数组与 Go 生态,兼顾安全性与可维护性。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

207

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

242

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

349

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

212

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

405

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

365

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

200

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

1091

2025.06.17

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1127

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号