如何正确使用Python复现SPSS中的K-S正态性检验结果

聖光之護

发布时间：2026-02-03 14:51:16

536人浏览过

来源于php中文网

原创

如何正确使用Python复现SPSS中的K-S正态性检验结果

spss默认对数据执行lilliefors修正的k-s检验（即估计均值和标准差后检验正态性），而scipy.stats.kstest默认检验是否服从**指定参数**的标准正态分布，二者原假设与参数设定不同，导致统计量和p值显著差异。

在进行正态性检验时，若直接用 scipy.stats.kstest(data, 'norm') 或 kstest(data, norm(loc=0,scale=1).cdf)，实际检验的是“数据是否来自标准正态分布 N(0,1)”，这在绝大多数实际场景中既不合理也不适用——因为原始数据（如年龄、身高）显然不以0为均值、1为标准差。而SPSS的“探索（Explore）→ 正态性检验”模块默认采用的是 Lilliefors校正的Kolmogorov-Smirnov检验：它仍基于KS统计量，但将总体均值和标准差由样本估计得出，并通过模拟或查表调整p值，从而解决“参数未知却代入检验”所导致的I类错误膨胀问题。

例如，对示例中的 age 变量（共42个整数观测值），SPSS报告 KS 统计量为 0.190（p 检验目标根本不同。

✅ 正确做法：使用参数自估计 + Lilliefors校正的检验方法。SciPy 自 1.8.0 版本起提供了 scipy.stats.goodness_of_fit 接口支持此功能：

Dora

创建令人惊叹的3D动画网站，无需编写一行代码。

下载

from scipy import stats
import numpy as np

# 加载 age 数据（注意：原题代码误将列名写为'weight'，应为'height'；此处取age列）
age = np.array([8,8,8,8,10,9,8,7,6,5,7,7,7,8,6,6,9,10,10,9,9,5,7,6,6,5,8,6,5,6,6,9,6,8,10,10,6,6,7,5,6,7,10])

# 方法1：使用 goodness_of_fit（推荐，自动处理Lilliefors逻辑）
res = stats.goodness_of_fit(stats.norm, age, statistic='ks', random_state=42)
print(f"Lilliefors KS statistic: {res.statistic:.4f}")  # ≈ 0.190
print(f"p-value (Monte Carlo): {res.pvalue:.3f}")       # ≈ 0.001–0.003，与SPSS一致

⚠️ 注意事项：

立即学习“Python免费学习笔记（深入）”；

goodness_of_fit 默认通过蒙特卡洛模拟计算p值（需指定 random_state 保证可重现），结果略有浮动，但统计量稳定；
若使用旧版SciPy（
对于小样本（n Shapiro-Wilk检验（scipy.stats.shapiro）通常更灵敏、更可靠，SPSS在样本量≤50时也优先报告该结果：
```
shapiro_stat, shapiro_p = stats.shapiro(age)
print(f"Shapiro-Wilk: W={shapiro_stat:.4f}, p={shapiro_p:.3f}")
```

? 总结：
SPSS与Python结果不一致，本质是检验范式差异——SPSS做的是参数未知的正态性检验（Lilliefors），而默认kstest做的是参数已知的分布匹配检验。要获得可比结果，必须统一检验逻辑：使用goodness_of_fit(..., statistic='ks')或lilliefors()，并优先考虑Shapiro-Wilk检验作为正态性评估的首选方法。

python元素的定义_编程语境下的数据结构元素与集合成员含义

如何在 Python（Kivy）中正确读写文件以避免多余换行符

计算两个事件序列在每日时间粒度上的重叠时长（秒）

如何在 Python 中正确保存和读取文件内容（避免换行符导致的格式问题）

如何在 Python 中正确保存和读取文件内容（避免换行符重复问题）

相关标签:

python go scipy 接口

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在Python中拦截并独占特定USB键盘的输入下一篇：如何用 Python 绘制带停靠段的累计行程时间序列图

作者最新文章

如何为已展开（unstack）的DataFrame添加总计列

2026-02-01 15:56

如何在 Laravel 中追加更新数据库字段内容（保留原有值）

2026-02-01 15:57

Spring MongoDB 实现去重查询并返回多字段 DTO 的正确聚合方案

2026-02-01 16:02

NSQ Go 客户端消费滞后问题的根源与优化方案

2026-02-01 16:29

NSQ Go 客户端消费滞后问题的完整解决方案

2026-02-01 16:41

NiFi REST API 单用户认证接入完整指南

2026-02-01 16:56

JavaScript 中通过单选按钮控制 HTML 元素的显示与隐藏

2026-02-01 17:07

Go Web 开发中使用 entr 实时重启服务时端口被占用问题的解决方案

2026-02-01 17:14

Go 中如何正确测试结构体方法（而非 Mock 接收器函数）

2026-02-01 17:21

JavaFX 多表联动选择的优雅实现方案

2026-02-01 17:43

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1230

2023.10.19