0

0

如何根据内嵌数字重排字符串中的单词

聖光之護

聖光之護

发布时间:2025-08-20 15:06:24

|

176人浏览过

|

来源于php中文网

原创

如何根据内嵌数字重排字符串中的单词

本教程将探讨如何根据字符串中内嵌的数字对单词进行重新排序。我们将以“my1kiran4name2is3”为例,目标输出为“my name is kiran”。文章将详细介绍一种基于Java正则表达式(Lookarounds)和Stream API的解决方案,解析其工作原理,并讨论该方法在简洁性与可读性之间的权衡,并提供确保正确排序的优化方案。

问题定义

给定一个字符串,其中包含由数字(1到9)后缀的单词。任务是根据这些数字对单词进行重新排列,使它们按照数字的升序出现,最终输出一个仅包含单词并以空格分隔的字符串。

输入示例: "my1kiran4name2is3"

期望输出: "my name is kiran"

解释:

  • my 对应数字 1
  • name 对应数字 2
  • is 对应数字 3
  • kiran 对应数字 4 按照数字升序排列后,得到 my, name, is, kiran。

核心思路

解决此类问题的基本思路可以概括为以下几个步骤:

  1. 分解: 将原始字符串分解成独立的“单词+数字”片段。
  2. 提取: 从每个片段中分别提取出单词和对应的数字。
  3. 映射: 将提取出的数字作为键,单词作为值,存储在一个数据结构中,以便后续按数字排序。
  4. 重排与组合: 按照数字的升序遍历存储的键值对,并将其对应的单词按顺序拼接成最终的字符串。

Java实现详解

以下是使用Java 8+ 的Stream API和正则表达式实现上述逻辑的示例代码。为了确保最终输出的顺序正确,我们特意使用了 TreeMap 来存储单词和数字的映射,因为它能自动根据键(即数字)进行排序。

腾讯交互翻译
腾讯交互翻译

腾讯AI Lab发布的一款AI辅助翻译产品

下载
import java.util.Arrays;
import java.util.Map;
import java.util.TreeMap;
import java.util.stream.Collectors;

public class StringReorderer {

    public static String reorderStringByNumbers(String inputString) {
        // 1. 使用正向后行断言 (?<=\d) 分割字符串
        //    这将字符串分割成 "单词+数字" 的片段,例如 "my1", "kiran4", "name2", "is3"
        Map<Integer, String> orderedWords = Arrays.asList(inputString.split("(?<=\d)"))
                .stream()
                // 2. 对每个片段,使用正向前行断言 (?=\d) 再次分割
                //    将 "单词+数字" 分割成 ["单词", "数字"] 数组,例如 ["my", "1"]
                .map(s -> s.split("(?=\d)"))
                // 3. 收集到 TreeMap 中,TreeMap 会根据键(数字)自动排序
                //    键是数字 (Integer.parseInt(e[1])),值是单词 (e[0])
                .collect(Collectors.toMap(
                        e -> Integer.parseInt(e[1]), // 键:将数字字符串转换为整数
                        e -> e[0],                   // 值:单词字符串
                        (oldValue, newValue) -> oldValue, // 合并函数,处理重复键(此处通常不发生)
                        TreeMap::new                  // 指定使用 TreeMap 来保证键的顺序
                ));

        // 4. 从 TreeMap 中获取所有单词(值),它们已按数字键排序,然后用空格连接
        return orderedWords.values()
                .stream()
                .collect(Collectors.joining(" "));
    }

    public static void main(String[] args) {
        String input = "my1kiran4name2is3";
        String output = reorderStringByNumbers(input);
        System.out.println("原始字符串: " + input);
        System.out.println("重排后字符串: " + output); // 期望输出: my name is kiran
    }
}

代码解析:

  1. inputString.split("(?<=\d)"):

    • split() 方法用于根据正则表达式将字符串分割成数组。
    • (?<=\d) 是一个正向后行断言 (Positive Lookbehind)。它表示匹配一个位置,该位置的前面必须是一个数字 (d)。
    • 效果: 它会在每个数字的后面进行分割,但不会将数字本身包含在分隔符中。
      • 例如,"my1kiran4name2is3" 会被分割成 ["my1", "kiran4", "name2", "is3"]。
  2. .map(s -> s.split("(?=\d)")):

    • map() 操作将流中的每个元素(例如 "my1")转换为一个新的元素。
    • s.split("(?=\d)") 再次使用 split()。
    • (?=\d) 是一个正向前行断言 (Positive Lookahead)。它表示匹配一个位置,该位置的后面必须是一个数字 (d)。
    • 效果: 它会在每个数字的前面进行分割,但同样不将数字包含在分隔符中。
      • 例如,"my1" 会被分割成 ["my", "1"]。
      • 最终,流中的元素将是 [["my", "1"], ["kiran", "4"], ["name", "2"], ["is", "3"]]。
  3. .collect(Collectors.toMap(e -> Integer.parseInt(e[1]), e -> e[0], (oldValue, newValue) -> oldValue, TreeMap::new)):

    • Collectors.toMap() 用于将流中的元素收集到一个 Map 中。
    • e -> Integer.parseInt(e[1]):定义了如何从每个数组 e 中提取键。e[1] 是数字字符串(例如 "1"),将其转换为 Integer。
    • e -> e[0]:定义了如何从每个数组 e 中提取值。e[0] 是单词字符串(例如 "my")。
    • (oldValue, newValue) -> oldValue:这是一个合并函数,用于处理当存在重复键时的情况。在这个特定问题中,由于数字是唯一的(1-9),通常不会触发。
    • TreeMap::new:这是一个关键的参数,它指定了要创建的 Map 的具体实现是 TreeMap。TreeMap 会根据其键的自然顺序(对于 Integer 来说就是数值大小)自动对元素进行排序。这确保了我们后续获取值时是按数字顺序的。
  4. orderedWords.values().stream().collect(Collectors.joining(" ")):

    • orderedWords.values() 获取 TreeMap 中所有值的集合。由于 TreeMap 保持了键的排序,因此这些值(单词)的迭代顺序也是按其对应数字排序的。
    • .stream() 将值集合转换为流。
    • Collectors.joining(" ") 将流中的所有字符串元素用空格连接起来,形成最终的输出字符串。

注意事项与优化

  • 可读性与维护性: 尽管上述解决方案非常简洁和函数式,但高度依赖正则表达式的 Lookaround 特性以及 Stream API 的链式调用,对于不熟悉这些概念的开发者来说,代码的可读性和维护性可能会有所降低。在实际项目中,如果团队成员对这些高级特性不熟悉,或者问题逻辑更复杂,可能需要考虑使用更传统的循环和条件判断来提高代码的清晰度。
  • 数字范围与类型: 本教程的解决方案假定数字是1到9的单个数字。如果数字可以是多位(例如 "word10"),当前的 (?<=\d) 和 (?=\d) 仍然可以正确工作,因为它们是基于单个数字的断言。Integer.parseInt() 也能处理多位数字。
  • 输入健壮性: 当前代码假设输入字符串格式始终正确,即每个单词后都紧跟着一个数字。如果存在以下情况,可能需要额外的错误处理:
    • 单词后面没有数字。
    • 数字不在单词的末尾。
    • 非数字字符出现在应该出现数字的位置。
    • 数字重复。 针对这些情况,可以考虑在解析阶段增加 try-catch 块或更严格的正则表达式匹配来验证输入。
  • 性能考量: 对于非常大的字符串或需要处理大量字符串的情况,Stream API 和正则表达式通常具有良好的性能。然而,如果性能是极致的关键,并且输入格式非常简单,手动迭代和解析可能会在某些特定场景下提供微小的性能优势,但通常不建议为了微小的性能提升而牺牲代码的简洁性和可读性。

总结

通过本教程,我们学习了如何利用Java的正则表达式(特别是正向后行断言和正向前行断言)和Stream API,结合 TreeMap 的排序特性,高效地解决根据内嵌数字重排字符串中单词的问题。这种方法展示了Java 8+ 强大而富有表现力的编程范式。在实际应用中,选择合适的解决方案时,应综合考虑代码的简洁性、可读性、性能需求以及对输入数据健壮性的要求。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

531

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

258

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

766

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

219

2023.08.11

正则表达式空格
正则表达式空格

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容,供大家免费下载体验。

357

2023.08.31

Python爬虫获取数据的方法
Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据,或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示
正则表达式空格如何表示

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容,可以访问下面的文章。

245

2023.11.17

正则表达式中如何匹配数字
正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

547

2023.12.06

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号