0

0

c# 高并发下使用 Regex 的性能问题和 Regex.CompileToAssembly

幻夢星雲

幻夢星雲

发布时间:2026-01-09 10:11:55

|

914人浏览过

|

来源于php中文网

原创

Regex高并发变慢主因是缓存争用与频繁重编译:弱引用LRU缓存+共享锁导致锁竞争,pattern动态时命中率趋零;应改用RegexGenerator(.NET7+)或静态预编译实例。

c# 高并发下使用 regex 的性能问题和 regex.compiletoassembly

Regex 在高并发场景下为什么会变慢?

因为默认的 Regex 实例不是线程安全的,且每次调用 new Regex(pattern) 或静态方法如 Regex.IsMatch(input, pattern) 时,.NET 会隐式缓存编译结果——但这个缓存是弱引用 + LRU 策略,高并发下容易失效或频繁重编译。更关键的是,缓存键只包含 patternRegexOptions,不区分调用上下文,多个线程争抢同一缓存项会触发内部锁(RegexCache.s_lock),成为瓶颈。

  • 现象:QPS 上千后,Regex.IsMatch 的 CPU 占用陡增,profiler 显示大量时间花在 RegexRunner.Scan 和锁等待上
  • 根本原因不是正则本身慢,而是编译开销和缓存同步开销被放大
  • 尤其当 pattern 来自配置或用户输入(无法提前预编译)、且 options 动态变化时,缓存命中率趋近于 0

Regex.CompileToAssembly 已被废弃,别再用了

Regex.CompileToAssembly 是 .NET Framework 2.0–4.x 提供的“把正则编译成独立 DLL”的方案,目的是绕过运行时编译。但它在 .NET Core/.NET 5+ 中**完全移除**,官方文档明确标记为 obsolete,且存在严重缺陷:

  • 生成的程序集无法跨平台(依赖 System.Text.RegularExpressions 的具体实现细节)
  • 每次 pattern 或 options 变更都要重新生成、部署新 DLL,运维成本爆炸
  • 生成的类型必须 public,破坏封装;且需反射加载,丢失编译期类型检查
  • 实际性能提升有限——现代 JIT 和 Regex 源生编译(RegexGenerator)已远超它

如果你在旧项目里还看到 Regex.CompileToAssembly 调用,第一件事是搜索替换为 RegexOptions.Compiled 或(更推荐)RegexGenerator

替代方案:用 RegexGenerator(.NET 7+ 推荐)或预编译实例

.NET 7 引入源码生成器 RegexGenerator,在编译期把正则转为纯 C# 代码,零运行时编译、零反射、无锁——这才是高并发下的正解。

[RegexGenerator(@"\d{3}-\d{2}-\d{4}", RegexOptions.None)]
public static partial class SsnRegex
{
    public static partial bool IsMatch(ReadOnlySpan<char> input);
}

使用时直接调用 SsnRegex.IsMatch(input),性能接近手写字符串扫描。注意:

  • 必须用 partial 类 + static 方法,且 generator 属性参数必须是编译期常量
  • 不支持运行时拼接的 pattern(比如 string.Format("{0}.*", userPattern)
  • 若还在用 .NET 6 或更早,退而求其次:把常用 pattern 提前构造为静态 Regex 实例,并显式指定 RegexOptions.Compiled

例如:

歌者PPT
歌者PPT

歌者PPT,AI 写 PPT 永久免费

下载
private static readonly Regex EmailRegex = new Regex(@"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$", RegexOptions.Compiled | RegexOptions.NonBacktracking);

⚠️ 注意:RegexOptions.Compiled 在 .NET 5+ 中已默认启用 JIT 编译,加不加影响不大;真正有用的是 RegexOptions.NonBacktracking(防止回溯爆炸)和确保实例复用。

动态 pattern 场景下怎么保性能?

当 pattern 必须来自数据库、API 或用户输入时,无法用 RegexGenerator,也不能每次 new —— 此时核心策略是「控制编译频次 + 隔离缓存」:

  • ConcurrentDictionary<string, Regex> 手动缓存,key 为 pattern + options.GetHashCode() 拼接字符串
  • 限制缓存大小(如最多 100 个),避免内存泄漏;用 Lazy<Regex> 防止并发重复编译
  • 对高频 pattern(如日志行解析),可预热:应用启动时主动编译并注入缓存
  • 绝对不要在循环里写 new Regex(pattern),哪怕 pattern 看似固定——JIT 不会帮你优化掉

一个最小可行缓存示例:

private static readonly ConcurrentDictionary<string, Lazy<Regex>> _regexCache = new();
public static Regex GetOrCompile(string pattern, RegexOptions options = RegexOptions.None)
{
    var key = $"{pattern}_{options.GetHashCode()}";
    return _regexCache.GetOrAdd(key, _ => new Lazy<Regex>(() => new Regex(pattern, options))).Value;
}

真正难的不是写对这十几行,而是意识到:正则不是“写完就扔”的胶水代码,高并发下它和数据库连接、内存分配一样,是需要显式治理的资源。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1031

2023.08.02

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1567

2023.10.24

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

887

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

463

2024.06.27

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1567

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

651

2023.11.24

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号