0

0

如何在数组列表中找到与目标数组最接近的数组(基于数值比例相似性)

碧海醫心

碧海醫心

发布时间:2026-01-12 18:41:02

|

966人浏览过

|

来源于php中文网

原创

如何在数组列表中找到与目标数组最接近的数组(基于数值比例相似性)

本文介绍一种基于元素间比值之和的数组相似性度量方法,用于从数组列表中快速定位与给定主数组最接近的数组索引,支持等长数组比较,并兼顾数值分布趋势的一致性。

在实际数据处理或机器学习预处理中,常需从多个候选数组中选出与参考数组“最相似”的一个。但“最接近”需明确定义——本文采用相对比例一致性作为核心指标:若两个等长数组在对应位置的数值比值(target[i] / candidate[i])越趋近于 1,则说明二者在尺度和变化趋势上越一致。因此,我们定义相似性得分 = 所有对应元素比值之和;该和越接近数组长度 n(即所有比值 ≈ 1),表示整体匹配度越高。

以下是完整、健壮的实现:

function findClosestArray(target, candidates) {
  if (!Array.isArray(target) || candidates.length === 0) {
    throw new Error('Invalid input: target must be an array and candidates must be a non-empty array of arrays');
  }

  // 辅助函数:计算 target 与单个 candidate 的相似性得分(比值和)
  const similarityScore = (arr1, arr2) => {
    if (arr1.length !== arr2.length) {
      // 可选策略:跳过长度不匹配项,或抛出错误;此处选择跳过(也可改为加惩罚项)
      return -Infinity; // 确保不被选中
    }
    return arr1.reduce((sum, val, i) => {
      const ratio = arr2[i] === 0 ? Infinity : val / arr2[i]; // 防零除
      return ratio === Infinity || isNaN(ratio) ? -Infinity : sum + ratio;
    }, 0);
  };

  // 计算每个候选数组的得分
  const scores = candidates.map(candidate => similarityScore(target, candidate));

  // 找到最高分(最接近 n)对应的索引;若全为 -Infinity 则返回 null
  const validScores = scores.filter(s => s > -Infinity);
  if (validScores.length === 0) {
    console.warn('No valid candidate arrays found (length mismatch or zero denominators)');
    return null;
  }

  const maxScore = Math.max(...validScores);
  return scores.indexOf(maxScore);
}

// 示例使用
const mainArr = [2237, 2192, 2234, 2223, 2196, 2279, 2160, 2123];
const otherArrays = [
  [1757, 1650, 1757, 1774, 1755, 1615, 1591, 1550],
  [1678, 1545, 1742, 1605, 1662, 1629, 1678, 1601]
];

const index = findClosestArray(mainArr, otherArrays);
console.log('Closest array index:', index); // 输出 0 或 1

关键特性说明:

阿里云AI平台
阿里云AI平台

阿里云AI平台

下载
  • 抗尺度干扰:使用比值而非差值,天然对整体缩放不敏感(如 [100,200] 与 [1000,2000] 比值均为 1);
  • 长度校验:自动跳过长度不匹配的候选数组(亦可扩展为插值对齐或截断填充);
  • 安全防护:显式处理除零、NaN 和无效输入,提升鲁棒性;
  • 可解释性强:得分理论最大值 = target.length(完全一致时),便于调试与阈值设定。

⚠️ 注意事项:

  • 该方法假设所有 candidate[i] > 0(正数场景)。若含负数或混合符号,建议改用余弦相似度归一化欧氏距离
  • 若需支持变长数组,可结合动态时间规整(DTW)或先做标准化(z-score)+ 填充/裁剪;
  • 对极端离群值敏感,必要时可加入中位数绝对偏差(MAD)预过滤。

该方案简洁高效,适用于实时匹配、模板识别、传感器信号粗对齐等场景,是轻量级数组相似性检索的实用基准解法。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

954

2023.09.19

传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

498

2024.06.04

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

25

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

44

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

177

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

50

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

92

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

227

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号