0

0

可以采用哪些KPI来衡量人工智能项目的成功?

王林

王林

发布时间:2023-04-10 09:21:05

|

1731人浏览过

|

来源于51CTO.COM

转载

调研机构IDC公司在2020年6月发布的一项研究报告表明,大约28%的人工智能计划遭遇失败。报告给出的理由是缺乏专业知识、缺乏相关数据以及缺乏足够集成的开发环境。为了建立一个持续改进机器学习的过程并避免陷入困境,确定关键绩效指标(KPI)现在是当务之急。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

可以采用哪些KPI来衡量人工智能项目的成功?

而在行业上游,可以由数据科学家来定义模型的技术性能指标。它们将根据所使用的算法类型而有所不同。在旨在预测某人的身高作为其年龄函数的回归的情况下,例如,可以求助于线性确定系数。

可以采用一个衡量预测质量的方程:如果相关系数的平方为零,回归线确定0%的点分布。反之,如果该系数为100%,则该数字等于1。因此,这表明预测的质量非常好。

预测与现实的偏差

评估回归的另一个指标是最小二乘法,它指的是损失函数。它包括通过计算实际值与预测线之间偏差的平方和来量化误差,然后通过最小化平方误差来拟合模型。在相同的逻辑中,可以利用平均绝对误差方法,该方法包括计算偏差的基本值的平均值。

法国咨询机构凯捷公司负责战略、数据和人工智能服务的CharlottePierron-Perlès总结说:“无论如何,这相当于衡量与我们试图预测的差距。”

例如,在用于垃圾邮件检测的分类算法中,有必要查找误报和漏报的垃圾邮件。PierronPerlès解释说:“例如,我们为一家化妆品集团开发了一种机器学习解决方案,可以优化生产线的效率。目的是在生产线开始时识别可能导致生产中断的有缺陷的化妆品。我们在与工厂经营者讨论之后与他们一起寻求一个模型来完成检测,即使这意味着检测到误报,也就是说,合格的化妆品可能被误认为是有缺陷的。”

基于误报和漏报的概念,其他三个指标允许评估分类模型:

(1)召回率(R)是指模型敏感度的测量值。它是正确识别的真实阳性(以新冠病毒检测呈阳性为例)与所有应检测的真实阳性(冠状病毒检测呈阳性+冠状病毒检测呈阴性实际是阳性)的比例:R=真阳性/真阳性+假阴性。

(2)精度(P)是指准确度的度量。它是正确的真阳性(新冠病毒检测呈阳性)与所有确定为阳性的结果(新冠病毒检测呈阳性+新冠病毒检测呈阴性)的比例:P=真阳性/真阳性+假阳性。

(3)调和平均值(F-score)衡量模型给出正确预测和拒绝其他预测的能力:F=2×精度×召回率/精度+召回率

可赞AI
可赞AI

文字一秒可视化,免费AI办公神器

下载

模型的推广

法国ESNKeyrus公司首席高级数据科学家DavidTsangHinSun强调说:“一旦构建成模型,其泛化能力将成为关键指标。”

那么如何估计它?通过测量预测和预期结果之间的差异,然后了解这种差异随时间的演变。他解释说,“在一段时间之后,我们可能会遇到分歧。这可能是由于数据集在质量和数量方面的训练不足而导致的学习不足(或过度拟合)。”

那么其解决方案是什么?例如,在图像识别模型的情况下,可以使用对抗性生成网络通过旋转或扭曲来增加图片学习的数量。另一种技术(适用于分类算法):合成少数过采样,它包括通过过采样增加数据集中低发生率示例的数量。

在过度学习的情况下也会出现分歧。在这种配置中,模型在训练后将不会局限于预期的相关性,但是由于过于专业化,它会捕获现场数据产生的噪声并产生不一致的结果。DavidTsangHinSun指出,“然后有必要检查训练数据集的质量,并可能调整变量的权重。”

而经济的关键绩效指标(KPI)依然存在。法国咨询机构AIBuilders公司首席执行官StéphaneRoder认为:“我们必须扪心自问,错误率是否与业务挑战相符。例如,保险商Lemonade公司开发了一种机器学习模块,可以在客户提出索赔后3分钟内根据所传达的信息(包括照片)向客户赔付保险金。考虑到节省的费用,一定的错误率会产生成本。在模型的整个生命周期中,特别是与总体拥有成本(TCO)相比,从开发到维护,检查这一测量值是非常重要。”

采用水平

即使在同一家公司内,预期的关键绩效指标(KPI)也可能有所不同。凯捷公司的CharlottePierronPerlès指出:“我们为一家具有国际地位的法国零售商开发了一个消费预测引擎。结果证明该模型的精确目标在百货商店销售的产品和新产品之间是不同的。后者的销售动态取决于因素,尤其是与市场反应相关的因素,从定义上来说,这些因素不太可控。”

最后一个关键绩效指标是采用水平。CharlottePierron-Perlès说:“即使一个模型质量很好,仅靠它自己是不够的。这需要开发具有面向用户体验的人工智能产品,既可用于业务,又可实现机器的承诺学习。”

StéphaneRoder总结说:“这个用户体验还将允许用户提供反馈,这将有助于在日常生产数据流之外提供人工智能知识。”​

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

406

2023.08.14

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

453

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

633

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

34

2025.10.21

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

3

2026.01.26

edge浏览器怎样设置主页 edge浏览器自定义设置教程
edge浏览器怎样设置主页 edge浏览器自定义设置教程

在Edge浏览器中设置主页,请依次点击右上角“...”图标 > 设置 > 开始、主页和新建标签页。在“Microsoft Edge 启动时”选择“打开以下页面”,点击“添加新页面”并输入网址。若要使用主页按钮,需在“外观”设置中开启“显示主页按钮”并设定网址。

6

2026.01.26

苹果官方查询网站 苹果手机正品激活查询入口
苹果官方查询网站 苹果手机正品激活查询入口

苹果官方查询网站主要通过 checkcoverage.apple.com/cn/zh/ 进行,可用于查询序列号(SN)对应的保修状态、激活日期及技术支持服务。此外,查找丢失设备请使用 iCloud.com/find,购买信息与物流可访问 Apple (中国大陆) 订单状态页面。

15

2026.01.26

npd人格什么意思 npd人格有什么特征
npd人格什么意思 npd人格有什么特征

NPD(Narcissistic Personality Disorder)即自恋型人格障碍,是一种心理健康问题,特点是极度夸大自我重要性、需要过度赞美与关注,同时极度缺乏共情能力,背后常掩藏着低自尊和不安全感,影响人际关系、工作和生活,通常在青少年时期开始显现,需由专业人士诊断。

3

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5.2万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号