0

0

Java 词法分析器中去除空行输出的两种高效方法

碧海醫心

碧海醫心

发布时间:2026-03-03 23:22:13

|

724人浏览过

|

来源于php中文网

原创

Java 词法分析器中去除空行输出的两种高效方法

本文介绍在 Java 词法分析器中避免 System.out.println() 输出空行的两种专业实践:一是在生成 token 数组时预过滤空白元素,二是在打印前动态跳过空字符串,确保每行仅输出有效 token。

本文介绍在 java 词法分析器中避免 `system.out.println()` 输出空行的两种专业实践:一是在生成 token 数组时预过滤空白元素,二是在打印前动态跳过空字符串,确保每行仅输出有效 token。

在实现词法分析器(Lexer)时,一个常见但易被忽视的问题是:经过注释移除、正则切分和语义映射后,tokenizeLine() 方法可能生成包含空字符串("")或仅含空白字符(如 " ")的 token 数组。当直接遍历并调用 System.out.println(token) 时,这些空白元素会触发换行,导致输出中出现大量冗余空行——正如示例输出中反复出现的孤立空行所示。

根本原因在于当前 tokenizeLine() 的切分逻辑(使用复杂正则 split())和后续 replaceAll("\s+", "") 处理存在边界缺陷:

  • split() 在连续分隔符或行首/行尾位置可能产生空字符串;
  • replaceAll("\s+", "") 仅清空 token 内部空白,但无法消除原本就为空的数组元素;
  • 后续 if-else 映射分支未对空字符串做防御性校验,导致空串被原样保留并最终输出。

推荐方案一:打印前过滤(简洁、低侵入、推荐初学者使用)
修改 Tokenize() 方法中的循环体,添加非空判断:

for (String token : tokens) {
    if (!token.isBlank()) { // Java 11+ 推荐:isBlank() 同时检查 null、"" 和纯空白
        System.out.println(token);
    }
}

⚠️ 注意:String.isBlank() 是 Java 11 引入的安全方法,比 !token.isEmpty() 或 !token.trim().isEmpty() 更健壮。若项目受限于 Java 8,可替换为 token != null && !token.trim().isEmpty()。

推荐方案二:预处理 token 数组(更彻底、适合生产环境)
在 tokenizeLine() 方法末尾,对结果数组进行流式过滤,彻底剔除无效元素:

import java.util.Arrays;
import java.util.function.Predicate;

// ... 在 tokenizeLine 方法内,return 语句前添加:
return Arrays.stream(tokens)
             .filter(Predicate.not(String::isBlank))
             .toArray(String[]::new);

该方式从源头净化数据,使后续所有消费方(如语法分析器、调试日志、测试断言)均无需重复校验,提升代码健壮性与可维护性。

AI Undetect
AI Undetect

让AI无法察觉,让文字更人性化,为文字体验创造无限可能。

下载

立即学习Java免费学习笔记(深入)”;

? 额外优化建议

  • 当前 token.matches("...") 使用的是全匹配(^...$),但部分正则(如 "[++]")存在转义歧义,建议统一改用 token.equals("++") 或预编译 Pattern 提升性能;
  • removeComments() 中的块注释正则 "/\*.*?\*/" 在跨行场景下可能失效(因 DOTALL 仅影响 .,而 readLine() 已按行读取),需确保注释均位于单行内,否则应改用逐字符状态机解析;
  • 最终错误提示 "SYNTAX ERROR: INVALID IDENTIFIER NAME" 被无条件打印,建议仅在检测到非法标识符时触发,避免干扰正常输出流。

通过上述任一方案,即可彻底消除输出中的空行,获得紧凑、规范的 token 序列,为后续语法分析奠定清晰基础。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

910

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

252

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

988

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

839

2023.08.22

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

411

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

368

2023.10.25

登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6511

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

840

2023.09.14

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

3

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.1万人学习

C# 教程
C# 教程

共94课时 | 10.6万人学习

Java 教程
Java 教程

共578课时 | 76.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号