
本文介绍一种简洁高效的方法,通过提取每项的 ID 子串并保留首次出现项,实现对格式为 "code1-code2-id-" 的字符串数组去重。核心思路是结合 filter() 与 findIndex(),避免嵌套循环,代码可读性强且逻辑清晰。
本文介绍一种简洁高效的方法,通过提取每项的 id 子串并保留首次出现项,实现对格式为 "code1-code2-id-" 的字符串数组去重。核心思路是结合 `filter()` 与 `findindex()`,避免嵌套循环,代码可读性强且逻辑清晰。
在处理结构化字符串数组(如 "code1-code2-id-" 格式)时,常需按某一部分(例如 id)去重,而非整个字符串。由于 id 总位于固定位置(第三个 - 分隔段),我们可先封装一个提取 ID 的辅助函数,再利用数组高阶方法实现语义清晰、性能合理的去重。
推荐方案如下:
const links = [
"13989664-34-1-",
"3588867-34-1-",
"4757546-34-2-",
"72469424-34-2-"
];
// 提取 id:按 '-' 分割后取索引为 2 的片段(即第三段)
const getId = (str) => str.split("-")[2];
// 过滤:仅保留「其 id 首次出现位置等于当前索引」的元素
const uniqueLinks = links.filter((item, index) =>
links.findIndex(el => getId(el) === getId(item)) === index
);
console.log(uniqueLinks); // ["13989664-34-1-", "4757546-34-2-"]该方案的关键在于 findIndex() 的语义:它返回目标 id 在整个数组中第一次出现的索引;而 filter() 的回调中传入的 index 是当前元素的位置。当二者相等时,说明这是该 id 的首次出现,应保留;否则为重复项,自动被过滤。
✅ 优势总结:
- 语义明确:无需手动维护临时集合或标志位,逻辑直指“保留每个 id 的首次出现”;
- 健壮性好:split("-")[2] 比基于长度的 substring() 更可靠(如 id 为多位数或含前导零时仍准确);
- 无副作用:纯函数式写法,不修改原数组,便于链式调用与测试;
- 可扩展性强:若格式变化(如 id 移至第 4 段),只需调整 getId 函数,主逻辑完全复用。
⚠️ 注意事项:
- 确保所有字符串均符合预期格式,否则 split("-")[2] 可能返回 undefined,建议在生产环境添加基础校验(如 str.includes('-') && str.split('-').length >= 3);
- 若需保留最后一次出现的项(而非首次),可改用 lastIndexOf 配合 reduceRight,但 filter + findIndex 方案天然适配“首现优先”场景;
- 对超大数组(如 >10⁵ 项),findIndex 在每次迭代中遍历可能导致 O(n²) 时间复杂度;此时建议先用 Map 预构建 id → firstIndex 映射,再单次遍历过滤,将复杂度优化至 O(n)。
总之,面对结构化字符串的条件去重,优先考虑“提取关键字段 + 高阶数组方法组合”,比手写 forEach + find 更简洁、更不易出错,也更符合现代 JavaScript 的工程实践。










