python中如何处理异常值

舞夢輝影

发布时间：2025-10-17 20:14:02

926人浏览过

来源于php中文网

原创

首先使用统计方法（如IQR）识别异常值，再通过箱线图可视化检测，随后选择删除、缩尾、填充或标记等方式处理，复杂场景可采用孤立森林等机器学习算法，最终依据数据分布与业务背景合理决策。

python中如何处理异常值

在Python中处理异常值通常涉及识别、分析和处理数据中的极端值，这些值可能对统计分析或机器学习模型产生负面影响。常用的方法结合了数据分析库（如pandas、numpy）和可视化工具（如matplotlib、seaborn）。以下是几种常见的处理方式：

1. 使用统计方法识别异常值

通过均值±标准差或四分位数范围（IQR）判断异常值：

IQR 方法（适用于非正态分布）：

计算第一四分位数（Q1）和第三四分位数（Q3）
IQR = Q3 - Q1
定义异常值范围：小于 Q1 - 1.5×IQR 或大于 Q3 + 1.5×IQR 的值为异常值

示例代码：

import pandas as pd
示例数据
data = pd.Series([10, 12, 14, 15, 100, 18, 20, 16, 13])

							
								
								
									动态WEB网站中的PHP和MySQL：直观的QuickPro指南第2版
									动态WEB网站中的PHP和MySQL详细反映实际程序的需求，仔细地探讨外部数据的验证(例如信用卡卡号的格式)、用户登录以及如何使用模板建立网页的标准外观。动态WEB网站中的PHP和MySQL的内容不仅仅是这些。书中还提到如何串联JavaScript与PHP让用户操作时更快、更方便。还有正确处理用户输入错误的方法，让网站看起来更专业。另外还引入大量来自PEAR外挂函数库的强大功能，对常用的、强大的包
								
								下载 
							
						
立即学习“Python免费学习笔记（深入）”；
Q1 = data.quantile(0.25)
Q3 = data.quantile(0.75)
IQR = Q3 - Q1
lower_bound = Q1 - 1.5  IQR
upper_bound = Q3 + 1.5  IQR
outliers = data[(data < lower_bound) | (data > upper_bound)]
print("异常值:", outliers.tolist())

2. 可视化检测异常值

使用箱线图（boxplot）或散点图直观查看异常值：

import matplotlib.pyplot as plt
plt.boxplot(data)
plt.title("Boxplot for Outlier Detection")
plt.show()

3. 处理异常值的方法

识别后可选择以下策略：

删除异常值：如果异常值是错误或极少数，可以直接过滤

clean_data = data[(data >= lower_bound) & (data <= upper_bound)]

替换为边界值（缩尾处理）：将异常值限制在合理范围内

data_clipped = data.clip(lower_bound, upper_bound)

用均值/中位数填充：适用于少量异常值

data_filled = data.copy()
data_filled[(data < lower_bound) | (data > upper_bound)] = data.median()

保留并标记：在建模时作为特征标记是否为异常


4. 使用机器学习方法检测
对于复杂数据，可用孤立森林（Isolation Forest）、LOF（局部异常因子）等算法：from sklearn.ensemble import IsolationForest
model = IsolationForest(contamination=0.1)  # 预估异常比例
pred = model.fit_predict(data.values.reshape(-1, 1))
pred == -1 表示异常
outliers_index = data.index[pred == -1]
基本上就这些。根据数据分布和业务背景选择合适的方法，避免盲目删除异常值，有时它们也包含重要信息。


					
													
								相关文章
							
							
																	
										Python 如何判断一个对象是否真的是 list 而不是其他可迭代对象
									
																	
										PyRFC 导入失败：_cyrfc DLL 加载错误的解决方案
									
																	
										pandas groupby 后 apply 比 agg/transform 慢在哪里？
									
																	
										Python 生成器表达式 vs 列表推导式在内存占用上的真实差距
									
																	
										Python argparse 如何实现“有这个参数就必须再提供另一个参数”
									
															
													
							
								
								
									python速学教程(入门到精通)
									python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！
								
								下载 
							
						
							
								相关标签:
								
									python 工具 red Python numpy pandas matplotlib 算法 数据分析								
							
						
						本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn
						
													上一篇：Pandas按组条件填充日期：利用ffill与where高效处理时间序列数据
													下一篇：python类方法的注意点
												
					

					
													
								
									 
										作者最新文章
									
								
																	
										
											
												GitHub 的官方网站是什么？GitHub 官方域名与访问方式
											
											
												2026-01-23 15:25
											
										
								
																	
										
											
												抖音商城买东西靠谱吗_抖音商城购物安全说明
											
											
												2026-01-23 15:35
											
										
								
																	
										
											
												如何在 Excel 中插入和修改 SmartArt 图示
											
											
												2026-01-23 15:45
											
										
								
																	
										
											
												mcjs免费秒玩入口网址_MCJS免费秒玩入口网页版我的世界最佳中文
											
											
												2026-01-23 15:46
											
										
								
																	
										
											
												毒蘑菇性能测试图形怎么画出来？毒蘑菇GPU渲染原理说明
											
											
												2026-01-23 15:57
											
										
								
																	
										
											
												扫描全能王解密版风险_扫描全能王解密版安全风险详解
											
											
												2026-01-23 15:58
											
										
								
																	
										
											
												空调加氟一般需要多少钱 空调几年加一次氟
											
											
												2026-01-23 16:49
											
										
								
																	
										
											
												手机充电口松动怎么变紧修需要多少钱
											
											
												2026-01-23 17:06
											
										
								
																	
										
											
												手机充电变慢了怎么回事怎么解决
											
											
												2026-01-23 17:09
											
										
								
																	
										
											
												电子邮箱怎么申请注册和使用
											
											
												2026-01-23 17:16
											
										
								
															
						
						
							
								 
									热门AI工具
								
								更多
							

							
																	
										
											
											
												DeepSeek
												幻方量化公司旗下的开源大模型平台
																									
																												AI大模型
																													开放平台
																											
																							
										
									
																	
										
											
											
												豆包大模型
												字节跳动自主研发的一系列大型语言模型
																									
																												AI大模型
																											
																							
										
									
																	
										
											
											
												通义千问
												阿里巴巴推出的全能AI助手
																									
																												AI大模型
																											
																							
										
									
																	
										
											
											
												腾讯元宝
												腾讯混元平台推出的AI助手
																									
																												文档处理
																													Excel 表格
																											
																							
										
									
																	
										
											
											
												文心一言
												文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。
																									
																												AI大模型
																													中文写作
																											
																							
										
									
																	
										
											
											
												讯飞写作
												基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿
																									
																												中文写作
																													写作工具
																											
																							
										
									
																	
										
											
											
												即梦AI
												一站式AI创作平台，免费AI图片和视频生成。
																									
																												图片拼接
																													图画生成
																											
																							
										
									
																	
										
											
											
												ChatGPT
												最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。
																									
																												AI大模型
																													中文写作
																											
																							
										
									
																	
										
											
											
												智谱清言 - 免费全能的AI助手
												智谱清言 - 免费全能的AI助手
																									
																												AI大模型
																													PC软件


			
				
                    
                
				
					
						 
							相关专题
						
						更多
					
					
													
								
								
									python开发工具
									php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。
									
										 
											773
										
										 
											2023.06.15
										
									
								
							
													
								
								
									python打包成可执行文件
									本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。
									
										 
											684
										
										 
											2023.07.20
										
									
								
							
													
								
								
									python能做什么
									python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。
									
										 
											765
										
										 
											2023.07.25
										
									
								
							
													
								
								
									format在python中的用法
									Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。
									
										 
											699
										
										 
											2023.07.31
										
									
								
							
													
								
								
									python教程
									Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。
									
										 
											1405
										
										 
											2023.08.03
										
									
								
							
													
								
								
									python环境变量的配置
									Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。
									
										 
											570
										
										 
											2023.08.04
										
									
								
							
													
								
								
									python eval
									eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。
									
										 
											579
										
										 
											2023.08.04
										
									
								
							
													
								
								
									scratch和python区别
									scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。
									
										 
											751
										
										 
											2023.08.11
										
									
								
							
													
								
								
									c++空格相关教程合集
									本专题整合了c++空格相关教程，阅读专题下面的文章了解更多详细内容。
									
										 
											0
										
										 
											2026.01.23
										
									
								
							
											
				

				
					
						 
							热门下载
						
						更多
					
					
						
							网站特效   /
							网站源码  /
							网站素材  /
							前端模板 
						
						
															
									
										
										[图片特效]jQuery 360度全景图插件
									
								
															
									
										
										[表单按钮]jQuery QQ登陆框效果
									
								
															
									
										
										[图片特效]电商网店主图展示代码
									
								
															
									
										
										[表单按钮]jQ顶部下拉ajax验证表单 jQuery顶部下拉ajax验证表单代码下载
									
								
															
									
										
										[表单按钮]jQuery表单步骤流程导航
									
								
															
									
										
										[图片特效]CSS3缩放切换效果焦点图特效
									
								
															
									
										
										[表单按钮]jQuery+CSS3实现多步注册表单进度条
									
								
															
									
										
										[表单按钮]jQuery实现Diy拖拽表单代码
									
								
															
									
										
										[图片特效]css3鼠标拖拽展示图片特效
									
								
															
									
										
										[表单按钮]jQuery实现汉字转换成拼音代码
									
								
													
						
															
									
										
										[电商源码]openaishop 
									
								
															
									
										
										[其它模板]思翔企(事)业单位文件柜 build 20080313 
									
								
															
									
										
										[企业站源码]雅龙智能装备工业设备类WordPress主题1.0 
									
								
															
									
										
										[电商源码]威发卡自动发卡系统 
									
								
															
									
										
										[电商源码]卡密分发系统 
									
								
															
									
										
										[电商源码]中华陶瓷网 
									
								
															
									
										
										[电商源码]简洁粉色食品公司网站 
									
								
															
									
										
										[电商源码]极速网店系统 
									
								
															
									
										
										[电商源码]淘宝妈妈_淘客推广系统 
									
								
															
									
										
										[电商源码]积客B2SCMS商城系统 
									
								
													
						
															
									
										
										[网站素材]美式复古手绘汉堡海报矢量模板 
									
								
															
									
										
										[网站素材]萌系卡通唐装小马插画矢量素材 
									
								
															
									
										
										[网站素材]超市购物宣传方形海报PSD源文件设计下载 
									
								
															
									
										
										[网站素材]粉色极简线条派对海报矢量模板 
									
								
															
									
										
										[网站素材]情人节主题香水价目表PS素材下载 
									
								
															
									
										
										[网站素材]2026马年蓝金梦幻海报矢量模板 
									
								
															
									
										
										[网站素材]2026马年可爱卡通插画矢量 
									
								
															
									
										
										[网站素材]2026新年喜庆灯笼矢量模板 
									
								
															
									
										
										[网站素材]中式古典园林凉亭风景矢量素材 
									
								
															
									
										
										[网站素材]2026马年创意数字矢量素材 
									
								
													
						
															
									
										
										[前端模板]驾照考试驾校HTML5网站模板 
									
								
															
									
										
										[前端模板]驾照培训服务机构宣传网站模板 
									
								
															
									
										
										[前端模板]HTML5房地产公司宣传网站模板 
									
								
															
									
										
										[前端模板]新鲜有机肉类宣传网站模板 
									
								
															
									
										
										[前端模板]响应式天气预报宣传网站模板 
									
								
															
									
										
										[前端模板]房屋建筑维修公司网站CSS模板 
									
								
															
									
										
										[前端模板]响应式志愿者服务网站模板 
									
								
															
									
										
										[前端模板]创意T恤打印店网站HTML5模板 
									
								
															
									
										
										[前端模板]网页开发岗位简历作品展示网页模板 
									
								
															
									
										
										[前端模板]响应式人力资源机构宣传网站模板 
									
								
													
					
					

				

				
					
                



				
					
						 
							相关下载
						
						更多
					
					
											动态WEB网站中的PHP和MySQL：直观的QuickPro指南第2版
										

				

				
					
						 
							精品课程
						
						更多
					
					
						
							相关推荐   /
							热门推荐  /
							最新课程 
						
						
													
								
									
								
								
									最新Python教程 从入门到精通

									
										共4课时 | 17.6万人学习
									
								
							
													
								
									
								
								
									Django 教程

									
										共28课时 | 3.4万人学习
									
								
							
													
								
									
								
								
									SciPy 教程

									
										共10课时 | 1.2万人学习
									
								
							
												

						
															
									
										
									
									
										JavaScript ES5基础线上课程教学

										
											共6课时 | 10.4万人学习
										
									
								
															
									
										
									
									
										最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

										
											共79课时 | 151.5万人学习
										
									
								
															
									
										
									
									
										phpStudy极速入门视频教程

										
											共6课时 | 53.4万人学习
										
									
								
													

						
															
										
											
										
										
											最新Python教程 从入门到精通

											
												共4课时 | 17.5万人学习
											
										
									
																
										
											
										
										
											JavaScript ES5基础线上课程教学

											
												共6课时 | 10.4万人学习
											
										
									
																
										
											
										
										
											PHP新手语法线上课程教学

											
												共13课时 | 0.9万人学习
											
										
									
														
						

					
				

				
					
						 
							最新文章
						
						更多
					
					
													fastapi 如何实现 WebSocket 断线重连的客户端示例
													如何让生成器支持 .send() 但保持类型提示正确
													numpy 如何用 einsum 实现高效的矩阵运算（爱因斯坦求和）
													typing.TypedDict vs dataclass vs NamedTuple 性能与适用场景对比
													如何让 json.dumps 序列化时保持 dict 插入顺序
													如何用 SymPy 更高效地因式分解代数表达式
													如何从嵌套 JSON 数据中高效提取指定键的全部值
													Python 中的参数命名：变量名与类型无关，但需警惕内置名称遮蔽
													Python for 循环里修改列表长度会导致什么问题？
													numpy 如何在不复制数据的情况下修改视图的 dtype