初级实战：如何用Java写一个简单的控制台博客搜索器_字符串匹配

P粉602998670

发布时间：2026-03-03 09:26:46

799人浏览过

来源于php中文网

原创

string.contains() 不适合博客搜索，因其仅支持严格子串匹配，无法处理大小写、空格、标点、拼写错误、同义词及模糊查询；预处理+tolowercase()+indexof() 或转义通配正则匹配（如 .*java.*config.*）是更实用的轻量替代方案。

初级实战：如何用java写一个简单的控制台博客搜索器_字符串匹配

为什么 `String.contains()` 不适合做博客搜索器

它只能判断子串存在，没法处理大小写、空格差异、标点干扰，更别说模糊匹配了。比如用户搜 "java setup"，但文章里写的是 "Java Setup Guide" 或 "java-setup"，contains() 直接返回 false。

真实博客内容杂：有中英文混排、多余空格、HTML 实体残留（如），甚至用户输错一个字母就搜不到——这不是功能缺陷，是设计起点错了。

用 toLowerCase().contains() 是最常见补救，但治标不治本：无法解决拼写错误、同义词、缩写（如 "jdk" vs "Java Development Kit"）
如果博客数据量超过几百条，每次遍历全文调用 contains() 会明显卡顿，尤其在老旧笔记本或 CI 环境里
别提前用正则——Pattern.compile() 每次新建开销大，且用户输入含 . * ? 时会意外触发异常

用 `String.indexOf()` + 预处理能撑多久

比 contains() 多一点控制权：可以跳过前导空格、统一空白符、忽略常见标点。但它仍是精确匹配，只是“更干净的精确”。适合单机小项目、原型验证、或你明确知道用户只会输完整关键词。

关键在预处理逻辑，不是函数本身：

立即学习“Java免费学习笔记（深入）”；

千问智学

阿里旗下AI教育应用（原夸克学习APP）

下载

对每篇博客正文，先执行 text.replaceAll("[\p{Punct}\s]+", " ").trim()，把所有标点和连续空白换成单个空格
用户输入也走同样清洗，再转小写，再用 indexOf() 查找
避免用 split(" ") 后逐词比对——中文没空格分词，"Java教程" 会被切碎，搜 "教程" 就失效
注意 indexOf() 返回 -1 表示未找到，别直接拿这个值当布尔用，容易漏判

简单又不太丢体验的折中方案：`String.matches()` 加基础通配

不用引入 Lucene 或 SQLite 全文索引，也能让搜索像那么回事。核心是把用户输入转成宽松正则，只支持 * 通配（表示任意字符序列），其余字符原样转义。

示例：用户输 "java * config" → 转成正则 java.*config，再用 text.toLowerCase().matches(pattern) 判断。

必须对用户输入做 Pattern.quote() 处理非 * 部分，否则 "j.d" 会被当成 j.任意字符d
matches() 默认全字符串匹配，所以要把 * 替换为 .*，并在首尾加 .*，即 .*java.*config.*
性能上比 contains() 略差，但用户无感；别用 find()，那需要额外编译 Pattern 对象，重复创建很伤
别支持 ? 或正则元字符——用户不是开发者，输错一个 [ 就崩，日志里全是 PatternSyntaxException

控制台输出结果时最容易被忽略的细节

搜索出 5 篇匹配文章，但用户扫一眼根本分不清哪篇更相关。光打印标题和前 50 字不够，尤其当多篇文章标题雷同（比如都叫 "Spring Boot 入门"）。

给每条结果加行号，用 System.out.printf("%2d. %s%n", index, title)，避免手算对齐错位
高亮匹配关键词：把原文中首次命中部分用 [关键词] 包裹，而不是全篇替换——否则中文里“配置”和“配置项”会互相污染
如果博客数据来自文件，记得检查编码：Files.readAllLines(path, StandardCharsets.UTF_8)，Windows 上默认 GBK 读出来全是乱码，错误信息是 MalformedInputException
别在循环里反复调用 System.out.println() 输出长文本，合起来用一次 printf 或构建 StringBuilder，否则控制台滚动卡顿明显

真正难的不是匹配算法，是让用户在没 GUI 的情况下，三秒内确认“这正是我要找的”。匹配准不准，一半看逻辑，一半看输出是不是把关键信息推到了他眼睛底下。

如何使用Java的Stream.iterate生成无穷序列_流式编程高级用法

如何使用Java的Timer和TimerTask实现定时器_简单任务调度实现

如何在Java中使用Arrays工具类操作数组_Java数组进阶技巧

为什么接口中定义的变量默认是public static final

Java里的ForkJoinPool的窃取机制(Work-Stealing)如何工作_任务分发原理

相关标签:

java spring spring boot String printf 字符串循环对象 windows 算法 sqlite lucene

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在Java中使用do-while实现交互式菜单_Java练手项目下一篇：Java中使用有界通配符实例化泛型类的原理与限制

作者最新文章

剪映怎么变速_剪映曲线变速设置

2026-03-03 17:29

如何提升简历文案的职场成熟度利用DeepSeek通过结构化叙事消除青涩感

2026-03-03 17:29

如何提升简历文案的逻辑一致性利用DeepSeek进行全篇结构化核查

2026-03-03 17:31

Win11怎么关闭系统的反馈提醒_Windows11隐私诊断反馈设置

2026-03-03 17:33

如何制作一套高颜值的PPT模板利用Gamma一键定制专属色彩体系

2026-03-03 17:33

淘宝闪购怎么开启免密支付_淘宝闪购小额免密设置

2026-03-03 17:34

QQ音乐怎么分享到微信_QQ音乐朋友圈分享

2026-03-03 17:34

如何提升代码的安全性和防攻击能力利用DeepSeek进行静态安全扫描

2026-03-03 17:37

网易云音乐怎么关闭自动续费_网易云音乐黑胶VIP取消

2026-03-03 17:39

Win11怎么设置应用通知关闭_Windows11通知和操作设置

2026-03-03 17:39

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

spring框架介绍

本专题整合了spring框架相关内容，想了解更多详细内容，请阅读专题下面的文章。

149

2025.08.06

Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用，涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造（CSRF）防护、会话管理与安全漏洞防范。通过实际项目案例，帮助学习者掌握如何使用 Spring Security 实现高安全性认证与授权机制，提升 Web 应用的安全性与用户数据保护。

2026.01.26

spring boot框架优点

spring boot框架的优点有简化配置、快速开发、内嵌服务器、微服务支持、自动化测试和生态系统支持。本专题为大家提供spring boot相关的文章、下载、课程内容，供大家免费下载体验。

138

2023.09.05

spring框架有哪些

spring框架有Spring Core、Spring MVC、Spring Data、Spring Security、Spring AOP和Spring Boot。详细介绍：1、Spring Core，通过将对象的创建和依赖关系的管理交给容器来实现，从而降低了组件之间的耦合度；2、Spring MVC，提供基于模型-视图-控制器的架构，用于开发灵活和可扩展的Web应用程序等。

407

2023.10.12

Java Spring Boot开发

本专题围绕 Java 主流开发框架 Spring Boot 展开，系统讲解依赖注入、配置管理、数据访问、RESTful API、微服务架构与安全认证等核心知识，并通过电商平台、博客系统与企业管理系统等项目实战，帮助学员掌握使用 Spring Boot 快速开发高效、稳定的企业级应用。

2025.08.19

Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性

Spring Boot 是一个基于 Spring 框架的 Java 开发框架，它通过约定优于配置的原则，大幅简化了 Spring 应用的初始搭建、配置和开发过程，让开发者可以快速构建独立的、生产级别的 Spring 应用，无需繁琐的样板配置，通常集成嵌入式服务器（如 Tomcat），提供“开箱即用”的体验，是构建微服务和 Web 应用的流行工具。

138

2025.12.22

Java Spring Boot 微服务实战

本专题深入讲解 Java Spring Boot 在微服务架构中的应用，内容涵盖服务注册与发现、REST API开发、配置中心、负载均衡、熔断与限流、日志与监控。通过实际项目案例（如电商订单系统），帮助开发者掌握从单体应用迁移到高可用微服务系统的完整流程与实战能力。

268

2025.12.24

Spring Boot企业级开发与MyBatis Plus实战

本专题面向 Java 后端开发者，系统讲解如何基于 Spring Boot 与 MyBatis Plus 构建高效、规范的企业级应用。内容涵盖项目架构设计、数据访问层封装、通用 CRUD 实现、分页与条件查询、代码生成器以及常见性能优化方案。通过完整实战案例，帮助开发者提升后端开发效率，减少重复代码，快速交付稳定可维护的业务系统。

2026.02.11