0

0

如何根据内嵌数字重排字符串中的单词

聖光之護

聖光之護

发布时间:2025-08-20 15:06:24

|

176人浏览过

|

来源于php中文网

原创

如何根据内嵌数字重排字符串中的单词

本教程将探讨如何根据字符串中内嵌的数字对单词进行重新排序。我们将以“my1kiran4name2is3”为例,目标输出为“my name is kiran”。文章将详细介绍一种基于Java正则表达式(Lookarounds)和Stream API的解决方案,解析其工作原理,并讨论该方法在简洁性与可读性之间的权衡,并提供确保正确排序的优化方案。

问题定义

给定一个字符串,其中包含由数字(1到9)后缀的单词。任务是根据这些数字对单词进行重新排列,使它们按照数字的升序出现,最终输出一个仅包含单词并以空格分隔的字符串。

输入示例: "my1kiran4name2is3"

期望输出: "my name is kiran"

解释:

  • my 对应数字 1
  • name 对应数字 2
  • is 对应数字 3
  • kiran 对应数字 4 按照数字升序排列后,得到 my, name, is, kiran。

核心思路

解决此类问题的基本思路可以概括为以下几个步骤:

  1. 分解: 将原始字符串分解成独立的“单词+数字”片段。
  2. 提取: 从每个片段中分别提取出单词和对应的数字。
  3. 映射: 将提取出的数字作为键,单词作为值,存储在一个数据结构中,以便后续按数字排序。
  4. 重排与组合: 按照数字的升序遍历存储的键值对,并将其对应的单词按顺序拼接成最终的字符串。

Java实现详解

以下是使用Java 8+ 的Stream API和正则表达式实现上述逻辑的示例代码。为了确保最终输出的顺序正确,我们特意使用了 TreeMap 来存储单词和数字的映射,因为它能自动根据键(即数字)进行排序。

Verbatik
Verbatik

Verbatik是一款AI驱动的文本到语音生成器,包含142种语言和口音的600多种自然声音

下载
import java.util.Arrays;
import java.util.Map;
import java.util.TreeMap;
import java.util.stream.Collectors;

public class StringReorderer {

    public static String reorderStringByNumbers(String inputString) {
        // 1. 使用正向后行断言 (?<=\\d) 分割字符串
        //    这将字符串分割成 "单词+数字" 的片段,例如 "my1", "kiran4", "name2", "is3"
        Map orderedWords = Arrays.asList(inputString.split("(?<=\\d)"))
                .stream()
                // 2. 对每个片段,使用正向前行断言 (?=\\d) 再次分割
                //    将 "单词+数字" 分割成 ["单词", "数字"] 数组,例如 ["my", "1"]
                .map(s -> s.split("(?=\\d)"))
                // 3. 收集到 TreeMap 中,TreeMap 会根据键(数字)自动排序
                //    键是数字 (Integer.parseInt(e[1])),值是单词 (e[0])
                .collect(Collectors.toMap(
                        e -> Integer.parseInt(e[1]), // 键:将数字字符串转换为整数
                        e -> e[0],                   // 值:单词字符串
                        (oldValue, newValue) -> oldValue, // 合并函数,处理重复键(此处通常不发生)
                        TreeMap::new                  // 指定使用 TreeMap 来保证键的顺序
                ));

        // 4. 从 TreeMap 中获取所有单词(值),它们已按数字键排序,然后用空格连接
        return orderedWords.values()
                .stream()
                .collect(Collectors.joining(" "));
    }

    public static void main(String[] args) {
        String input = "my1kiran4name2is3";
        String output = reorderStringByNumbers(input);
        System.out.println("原始字符串: " + input);
        System.out.println("重排后字符串: " + output); // 期望输出: my name is kiran
    }
}

代码解析:

  1. inputString.split("(?:

    • split() 方法用于根据正则表达式将字符串分割成数组。
    • (?正向后行断言 (Positive Lookbehind)。它表示匹配一个位置,该位置的前面必须是一个数字 (\d)。
    • 效果: 它会在每个数字的后面进行分割,但不会将数字本身包含在分隔符中。
      • 例如,"my1kiran4name2is3" 会被分割成 ["my1", "kiran4", "name2", "is3"]。
  2. .map(s -> s.split("(?=\\d)")):

    • map() 操作将流中的每个元素(例如 "my1")转换为一个新的元素。
    • s.split("(?=\\d)") 再次使用 split()。
    • (?=\\d) 是一个正向前行断言 (Positive Lookahead)。它表示匹配一个位置,该位置的后面必须是一个数字 (\d)。
    • 效果: 它会在每个数字的前面进行分割,但同样不将数字包含在分隔符中。
      • 例如,"my1" 会被分割成 ["my", "1"]。
      • 最终,流中的元素将是 [["my", "1"], ["kiran", "4"], ["name", "2"], ["is", "3"]]。
  3. .collect(Collectors.toMap(e -> Integer.parseInt(e[1]), e -> e[0], (oldValue, newValue) -> oldValue, TreeMap::new)):

    • Collectors.toMap() 用于将流中的元素收集到一个 Map 中。
    • e -> Integer.parseInt(e[1]):定义了如何从每个数组 e 中提取键。e[1] 是数字字符串(例如 "1"),将其转换为 Integer。
    • e -> e[0]:定义了如何从每个数组 e 中提取值。e[0] 是单词字符串(例如 "my")。
    • (oldValue, newValue) -> oldValue:这是一个合并函数,用于处理当存在重复键时的情况。在这个特定问题中,由于数字是唯一的(1-9),通常不会触发。
    • TreeMap::new:这是一个关键的参数,它指定了要创建的 Map 的具体实现是 TreeMap。TreeMap 会根据其键的自然顺序(对于 Integer 来说就是数值大小)自动对元素进行排序。这确保了我们后续获取值时是按数字顺序的。
  4. orderedWords.values().stream().collect(Collectors.joining(" ")):

    • orderedWords.values() 获取 TreeMap 中所有值的集合。由于 TreeMap 保持了键的排序,因此这些值(单词)的迭代顺序也是按其对应数字排序的。
    • .stream() 将值集合转换为流。
    • Collectors.joining(" ") 将流中的所有字符串元素用空格连接起来,形成最终的输出字符串。

注意事项与优化

  • 可读性与维护性: 尽管上述解决方案非常简洁和函数式,但高度依赖正则表达式的 Lookaround 特性以及 Stream API 的链式调用,对于不熟悉这些概念的开发者来说,代码的可读性和维护性可能会有所降低。在实际项目中,如果团队成员对这些高级特性不熟悉,或者问题逻辑更复杂,可能需要考虑使用更传统的循环和条件判断来提高代码的清晰度。
  • 数字范围与类型: 本教程的解决方案假定数字是1到9的单个数字。如果数字可以是多位(例如 "word10"),当前的 (?
  • 输入健壮性: 当前代码假设输入字符串格式始终正确,即每个单词后都紧跟着一个数字。如果存在以下情况,可能需要额外的错误处理:
    • 单词后面没有数字。
    • 数字不在单词的末尾。
    • 非数字字符出现在应该出现数字的位置。
    • 数字重复。 针对这些情况,可以考虑在解析阶段增加 try-catch 块或更严格的正则表达式匹配来验证输入。
  • 性能考量: 对于非常大的字符串或需要处理大量字符串的情况,Stream API 和正则表达式通常具有良好的性能。然而,如果性能是极致的关键,并且输入格式非常简单,手动迭代和解析可能会在某些特定场景下提供微小的性能优势,但通常不建议为了微小的性能提升而牺牲代码的简洁性和可读性。

总结

通过本教程,我们学习了如何利用Java的正则表达式(特别是正向后行断言和正向前行断言)和Stream API,结合 TreeMap 的排序特性,高效地解决根据内嵌数字重排字符串中单词的问题。这种方法展示了Java 8+ 强大而富有表现力的编程范式。在实际应用中,选择合适的解决方案时,应综合考虑代码的简洁性、可读性、性能需求以及对输入数据健壮性的要求。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

845

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

743

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

740

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

400

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

447

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

431

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16946

2023.08.03

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

25

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号