0

0

C# KMP字符串匹配算法 C#如何实现KMP算法

幻夢星雲

幻夢星雲

发布时间:2026-02-22 12:16:03

|

625人浏览过

|

来源于php中文网

原创

kmp算法在c#中有五种高效实现方式:一、手动构建next数组与匹配逻辑;二、用span避免内存分配;三、封装为支持多匹配的扩展方法;四、用memorypool池化next数组;五、通过unsafe指针加速构建。

c# kmp字符串匹配算法 c#如何实现kmp算法

如果您需要在C#中实现高效的子串查找功能,而传统暴力匹配在长文本中性能不足,则KMP(Knuth-Morris-Pratt)算法可显著减少不必要的字符比较。以下是实现KMP算法的多种方式:

一、手动实现KMP核心逻辑(含next数组构建)

该方法完全自主编写KMP的两个关键部分:前缀函数(next数组)计算与主匹配过程,便于理解算法本质并支持自定义优化。

1、定义一个静态方法ComputeNext,接收模式串pattern,返回int[]类型的next数组;

2、遍历pattern,使用双指针i和j,初始j=0,i从1开始,若pattern[i]==pattern[j]则j++并赋值next[i]=j,否则当j>0时令j=next[j-1]继续回溯;

3、定义主匹配方法KmpSearch,接收text和pattern,先调用ComputeNext获取next数组;

4、使用指针i遍历text,指针j遍历pattern,若text[i]==pattern[j]则i++、j++;

5、若j达到pattern.Length,返回i-j作为首次匹配起始索引;

6、若不匹配且j>0,令j=next[j-1];若j==0且仍不匹配,则i++;

7、遍历结束后未找到则返回-1。

二、使用Span提升性能的无分配实现

该方法利用C# 7.2+的Span避免字符串切片产生的内存分配,在高频或大文本匹配场景下降低GC压力。

1、将输入text和pattern分别转为ReadOnlySpan

2、为next数组分配栈空间:Span next = stackalloc int[pattern.Length];

3、使用ref readonly Span引用pattern,确保不触发复制;

4、在ComputeNext逻辑中全部基于Span索引操作,禁用string.Substring等分配操作;

5、主循环中用text.Slice(i, remaining)替代text.Substring(i),但实际仅用索引比对;

6、所有字符访问均通过span[index]语法,保障零装箱与缓存友好性;

7、返回结果为int类型位置索引,不封装为IEnumerable以避免迭代器开销。

三、封装为扩展方法并支持多匹配结果

该方法将KMP逻辑封装为string类型的扩展方法,提供简洁API,并内置全量匹配位置收集能力,适用于需获取所有出现位置的场景。

1、声明静态类StringExtensions,并定义public static IEnumerable KmpFindAll(this string text, string pattern);

2、内部校验text与pattern是否为null或pattern为空,空pattern按约定返回0到text.Length所有索引;

3、调用私有方法BuildNextArray生成next数组;

MD5校验和计算小程序(C)
MD5校验和计算小程序(C)

C编写,实现字符串摘要、文件摘要两个功能。里面主要包含3个文件: Md5.cpp、Md5.h、Main.cpp。其中Md5.cpp是算法的代码,里的代码大多是从 rfc-1321 里copy过来的;Main.cpp是主程序。

下载

4、主循环中每次成功匹配后,记录当前位置i - pattern.Length + 1;

5、匹配成功后令j = next[j - 1](而非归零),继续搜索重叠匹配;

6、使用yield return逐个输出索引,避免一次性分配List

7、调用示例:text.KmpFindAll("abc").ToArray()可直接获取全部起始位置数组。

四、基于Memory与IMemoryOwner的池化next数组实现

该方法面向高吞吐服务场景,复用next数组内存块,避免频繁堆分配,配合MemoryPool.Shared实现对象池管理。

1、引入System.Buffers命名空间,声明private static readonly MemoryPool s_pool = MemoryPool.Shared;

2、在KmpSearch方法内请求IMemoryOwner owner = s_pool.Rent(pattern.Length);

3、通过owner.Memory.Span获取Span nextSpan用于构建next数组;

4、匹配完成后立即调用owner.Dispose()将内存归还池中;

5、text与pattern仍为string,但内部比对逻辑使用AsSpan()转为ReadOnlySpan

6、整个生命周期内无new int[pattern.Length]语句;

7、next数组大小严格按pattern.Length申请,不预留冗余空间。

五、使用unsafe代码块加速next数组构建

该方法启用unsafe上下文,通过指针直接操作字符内存地址,消除边界检查开销,在超长pattern(如数万字符)构建next时获得可观加速。

1、在项目文件中启用true

2、在ComputeNext方法前添加unsafe关键字,参数pattern改为string pattern;

3、使用fixed (char* p = pattern)固定pattern首地址,获取char* ptr = p;

4、用指针算术ptr[i]替代pattern[i],j变量也以int*方式管理(如int* nextPtr = stackalloc int[n]);

5、所有循环内比较使用*(ptr + i) == *(ptr + j);

6、next数组填充使用*(nextPtr + i) = j;

7、主匹配循环同样采用fixed + 指针遍历text,跳过托管数组索引验证。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

810

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

246

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

826

2024.03.01

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

616

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

217

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1557

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

642

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1006

2024.03.22

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

928

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 9.9万人学习

C 教程
C 教程

共75课时 | 4.9万人学习

C++教程
C++教程

共115课时 | 18.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号