
问题背景与挑战
在前端开发中,我们经常会遇到需要从非结构化字符串中提取特定信息的需求。例如,从一个混合了字母、数字和符号的字符串中提取所有数值。一个常见的需求是将字符串 "00ghj67 h4 h000ytff700jhjk80" 转换为数组 [0, 0, 67, 4, 0, 0, 0, 700, 80]。
这个任务的挑战在于:
- 保留零: 字符串中的前导零或独立零(如 "00" 或 "h000" 中的每个 0)需要作为独立的数字 0 被保留,而不是被忽略或合并。
- 避免正则表达式: 在某些特定场景下,我们可能被要求不使用正则表达式来完成此任务,例如为了学习基础字符串处理逻辑或满足特定性能要求。
- 正确解析多位数字: 连续的数字字符应被解析为一个完整的数字(如 "67" 解析为 67)。
传统方法的局限性
初次尝试解决此问题时,开发者可能会倾向于逐字符遍历,并使用 parseInt() 函数来转换累积的数字字符串。然而,这种方法在处理零时容易出现问题。例如,如果简单地累积数字并使用 parseInt(),可能会丢失独立的零。
考虑以下示例代码,它无法完全满足需求,特别是在保留所有零方面:
function extractNumbersInitial(string) {
let arrNumbs = [];
let numbers = "";
for (let i = 0; i < string.length; i++) {
let elem = string.charAt(i);
if (!isNaN(elem) && elem !== ' ') { // 检查是否是数字字符
numbers += elem;
} else { // 遇到非数字字符或空格
if (numbers !== "") {
arrNumbs.push(parseInt(numbers, 10)); // 转换为数字
numbers = "";
}
}
}
// 处理字符串末尾的数字
if (numbers !== "") {
arrNumbs.push(parseInt(numbers, 10));
}
return arrNumbs;
}
// 测试原始字符串
console.log(extractNumbersInitial("00ghj67 h4 h000ytff700jhjk80"));
// 预期输出:[0, 0, 67, 4, 0, 0, 0, 700, 80]
// 实际输出:[0, 67, 4, 0, 700, 80] - 丢失了部分零上述代码的 parseInt() 在处理像 "00" 这样的字符串时,会将其解析为单个 0。更重要的是,它没有机制将 0 单独推入数组,除非它是一个独立且后面跟着非数字字符的数字字符串。
立即学习“Java免费学习笔记(深入)”;
优化方案:迭代与特殊零处理
为了克服上述局限性,我们需要一个更精细的字符处理逻辑,尤其是在遇到 0 时。核心思想是:当遇到 0 并且当前没有累积的数字时,立即将其作为一个独立的 0 推入数组。否则,则像处理其他数字一样累积它。
以下是优化后的解决方案:
/**
* 从混合字符串中提取数字数组,并保留所有零。
*
* @param {string} inputString 包含字母、数字和空格的混合字符串。
* @returns {number[]} 提取出的数字数组。
*/
function extractNumbersOptimized(inputString) {
let resultArray = []; // 存储提取出的数字
let currentNumberString = ""; // 累积当前正在解析的数字字符串
// 辅助函数:将累积的数字字符串转换为数字并添加到结果数组
const addCurrentNumber = () => {
if (currentNumberString) { // 只有当 currentNumberString 非空时才添加
resultArray.push(+currentNumberString); // 使用一元加号快速转换为数字
currentNumberString = ""; // 重置累积字符串
}
};
// 遍历输入字符串的每一个字符
for (const char of inputString) {
// 1. 特殊处理独立的或前导的零
// 如果当前没有累积的数字字符串,且当前字符是 '0',则立即将其作为 0 添加到数组
if (!currentNumberString && char === '0') {
resultArray.push(0);
}
// 2. 处理非数字字符
// 如果当前字符不是数字('0'到'9'之外),则意味着一个数字段结束
else if (char < '0' || char > '9') {
addCurrentNumber(); // 将之前累积的数字添加到数组
}
// 3. 处理数字字符
// 如果当前字符是数字,且不是作为独立零被特殊处理的,则累积它
else {
currentNumberString += char;
}
}
// 循环结束后,检查是否还有未添加的数字字符串(例如字符串以数字结尾)
addCurrentNumber();
return resultArray;
}
// 示例用法
const input = "00ghj67 h4 h000ytff700jhjk80";
const output = extractNumbersOptimized(input);
console.log(output); // 预期输出: [0, 0, 67, 4, 0, 0, 0, 700, 80]
const anotherInput = "123abc0def45g00";
console.log(extractNumbersOptimized(anotherInput)); // 预期输出: [123, 0, 45, 0, 0]代码解析与注意事项
- resultArray 和 currentNumberString: resultArray 用于存储最终的数字结果,currentNumberString 则在遍历过程中累积连续的数字字符。
- addCurrentNumber() 辅助函数: 这是一个局部函数,用于封装将 currentNumberString 转换为数字并推入 resultArray 的逻辑。它确保只有在 currentNumberString 非空时才执行操作,避免将空字符串转换为 0。
- for (const char of inputString): 使用 for...of 循环遍历字符串,这是一种简洁且现代的 JavaScript 遍历方式。
-
if (!currentNumberString && char === '0') resultArray.push(0);: 这是解决零丢失问题的关键。
- !currentNumberString 检查当前是否正在累积一个多位数字。如果 currentNumberString 为空,意味着我们刚从一个非数字字符跳过来,或者这是字符串的开头。
- char === '0' 检查当前字符是否为零。
- 如果两者都满足,说明这是一个独立的零或某个数字串的前导零(且该零被视为独立数字),我们立即将其 0 推入 resultArray。
- else if (char '9') addCurrentNumber();: 当遇到非数字字符时,表示当前的数字段已经结束。此时调用 addCurrentNumber() 将之前累积的 currentNumberString 转换为数字并添加到结果数组。
- else currentNumberString += char;: 如果当前字符是数字,且没有被特殊处理为独立零,则将其追加到 currentNumberString 中,继续累积多位数字。
- 循环结束后的 addCurrentNumber(): 字符串可能以一个或多个数字结尾。循环结束后,currentNumberString 中可能还存有最后一个数字,因此需要再次调用 addCurrentNumber() 来确保将其添加到 resultArray 中。
- +currentNumberString: 使用一元加号 + 是将字符串转换为数字的一种简洁高效的方法。它比 parseInt() 或 Number() 更短,且效果相同。
总结
通过上述优化后的迭代方法,我们成功地在不使用正则表达式的情况下,从混合字符串中提取了所有数字,并特别处理了零的保留问题。这种方法结构清晰,逻辑严谨,能够满足特定场景下的需求。理解这种逐字符处理的逻辑,有助于加深对字符串操作和数据类型转换的理解,为更复杂的字符串解析任务打下基础。










