0

0

优化SciPy优化函数输入:解决矩阵维度不匹配与提升代码效率

花韻仙語

花韻仙語

发布时间:2025-07-28 20:24:12

|

946人浏览过

|

来源于php中文网

原创

优化SciPy优化函数输入:解决矩阵维度不匹配与提升代码效率

本文旨在解决使用scipy.optimize.fmin时因输入数组被展平导致的矩阵维度错误,并提供一套全面的优化方案。内容涵盖如何在目标函数内部重塑输入数组、利用NumPy向量化操作提升计算效率、推荐使用更现代且功能强大的scipy.optimize.minimize函数,并探讨针对特定问题采用线性代数解法的可能性,旨在帮助读者编写更健壮、高效的数值优化代码。

理解并解决scipy.optimize.fmin的输入维度问题

在使用scipy.optimize.fmin进行数值优化时,一个常见的陷阱是其默认行为会将传递给目标函数的初始猜测值(x0参数)展平(ravel)成一维数组,无论其原始形状如何。这导致当目标函数内部期望接收多维数组(如矩阵)时,会出现维度不匹配的错误,例如“matrices are different sizes”或“input operand 1 has a mismatch in its core dimension”。

问题根源: optimize.fmin为了通用性,将所有输入参数视为一维向量进行处理。因此,如果您传入一个 (4, 4) 的矩阵作为初始猜测 guess,在目标函数 objfunc 内部,guess 会变成一个 (16,) 的一维数组。

解决方案: 最直接的解决办法是在目标函数 objfunc 的开头,手动将展平后的 guess 数组重塑(reshape)回其预期的多维形状。

import numpy as np
from scipy import optimize
import math

# 定义矩阵维度
rows, cols = 4, 4

# 示例数据
guess = np.array([
    [1, -1, 2, 0],
    [0,  2, 0, 0],
    [1,  0, 0, 1],
    [0,  1, 2, 0]
])
inputArray = np.array([
    [2, 4, 6, 9],
    [2, 3, 1, 0],
    [7, 2, 6, 4],
    [1, 5, 2, 1]
])
goalArray = np.array([
    [14, 5, 17, 17],
    [4,  6, 2,   0],
    [3,  9, 8,  10],
    [16, 7, 13,  8]
])

# 修正后的目标函数
def objfunc(guess_flat, inputArray, goalArray):
    # 核心修正:将展平的guess_flat重塑回原始矩阵形状
    guess = guess_flat.reshape((rows, cols))

    model = guess @ inputArray # 矩阵乘法

    # 计算误差:使用NumPy向量化操作替代循环
    # 原始问题中是求差的绝对值之和,等同于L1范数
    # sum_error = np.sum(np.abs(goalArray - model))
    # 如果是欧几里得距离(L2范数),则使用:
    sum_error = np.linalg.norm(goalArray - model, ord='fro') # Frobenius范数等同于展平后的L2范数

    return sum_error

# 验证修正后的目标函数
print(f"Initial guess shape: {guess.shape}")
print(f"Input array shape: {inputArray.shape}")
print(f"Initial objective function value: {objfunc(guess.ravel(), inputArray, goalArray):.4f}")

# 调用optimize.fmin进行优化
# 注意:fmin的x0参数应为一维数组,因此需要对guess进行ravel()操作
minimum_fmin = optimize.fmin(objfunc, guess.ravel(), args=(inputArray, goalArray))

print("\n--- Results from optimize.fmin ---")
print(f"Optimized flat array: {minimum_fmin}")
print(f"Reshaped optimized matrix:\n{minimum_fmin.reshape((rows, cols))}")

优化目标函数:利用NumPy的向量化能力

原始的目标函数中使用了嵌套的 for 循环来计算误差。在处理NumPy数组时,应尽量避免显式的Python循环,因为NumPy提供了高效的向量化操作,可以显著提升计算性能。

改进前:

    sum = 0
    for i in range(rows):
        for j in range(cols):
            sum = sum + math.sqrt((goalArray[i][j] - model[i][j]) ** 2)

这段代码实际上是在计算矩阵元素差的绝对值之和(L1范数),因为 math.sqrt(x**2) 等价于 abs(x)。

改进后: 可以使用NumPy的 np.abs 和 np.sum 函数进行向量化操作,或者更推荐使用 np.linalg.norm 来清晰表达计算的是哪种范数。

  • 计算元素差的绝对值之和(L1范数):
    sum_error = np.sum(np.abs(goalArray - model))
  • 计算元素差的平方和的平方根(Frobenius范数,等同于展平后的L2范数):
    sum_error = np.sqrt(np.sum((goalArray - model) ** 2))
    # 或者更简洁、更清晰地使用 numpy.linalg.norm
    sum_error = np.linalg.norm(goalArray - model, ord='fro')

    在上述示例代码中,我们已经将目标函数 objfunc 更新为使用 np.linalg.norm,这不仅提高了效率,也使代码意图更加明确。

推荐的现代优化方法:scipy.optimize.minimize

scipy.optimize.fmin 是一个遗留函数,尽管仍可使用,但对于新代码的开发,官方推荐使用更强大、更灵活的 scipy.optimize.minimize 函数。minimize 提供了一个统一的接口来访问多种优化算法(如BFGS, Nelder-Mead, SLSQP等),并且其文档明确指出其 x0 参数必须是一维数组,这与 fmin 的内部行为保持一致。

SoftGist
SoftGist

SoftGist是一个软件工具目录站,每天为您带来最好、最令人兴奋的软件新产品。

下载

使用 optimize.minimize:

# 使用optimize.minimize进行优化
# x0 参数必须是展平的一维数组
minimum_result = optimize.minimize(objfunc, guess.ravel(), args=(inputArray, goalArray), method='BFGS')

print("\n--- Results from optimize.minimize (BFGS) ---")
print(f"Optimization successful: {minimum_result.success}")
print(f"Message: {minimum_result.message}")
print(f"Final objective function value: {minimum_result.fun:.4f}")
print(f"Optimized flat array: {minimum_result.x}")
print(f"Reshaped optimized matrix:\n{minimum_result.x.reshape((rows, cols))}")

# 尝试不同的优化方法,例如'Nelder-Mead' (fmin的默认方法)
minimum_result_nm = optimize.minimize(objfunc, guess.ravel(), args=(inputArray, goalArray), method='Nelder-Mead')
print("\n--- Results from optimize.minimize (Nelder-Mead) ---")
print(f"Optimization successful: {minimum_result_nm.success}")
print(f"Message: {minimum_result_nm.message}")
print(f"Final objective function value: {minimum_result_nm.fun:.4f}")
print(f"Reshaped optimized matrix:\n{minimum_result_nm.x.reshape((rows, cols))}")

optimize.minimize 的优势:

  • 统一接口: 通过 method 参数轻松切换不同的优化算法。
  • 更丰富的输出: 返回一个 OptimizeResult 对象,包含优化是否成功、迭代次数、梯度信息等详细结果。
  • 更清晰的文档: 对输入参数和算法行为有更明确的说明。
  • 处理非平滑目标函数: 对于像绝对值之和这类非平滑(不可导)的目标函数,Nelder-Mead 等不依赖梯度的算法可能更适用,而 BFGS 等梯度下降算法则需要目标函数是可导的。

特定问题的线性代数解决方案

值得注意的是,对于本教程中的特定问题——寻找一个转换矩阵 guess,使得 guess @ inputArray 尽可能接近 goalArray,如果 inputArray 是非奇异矩阵(可逆),这实际上是一个线性方程组问题,可以通过线性代数直接求解,而无需使用数值优化。

方程可以表示为 X * A = B,其中 X 是我们寻找的 guess 矩阵,A 是 inputArray,B 是 goalArray。 在Python/NumPy中,矩阵乘法的顺序通常是 X @ A。要解出 X,如果 A 可逆,则 X = B @ A_inv。

然而,numpy.linalg.solve(A, B) 函数用于求解 A @ X = B 形式的线性方程组。因此,我们需要对矩阵进行转置以适应 solve 函数的签名: guess @ inputArray = goalArray 两边同时右乘 inputArray 的逆矩阵: guess = goalArray @ np.linalg.inv(inputArray)

或者,使用 numpy.linalg.solve,它更数值稳定: 如果 A @ X = B,则 X = np.linalg.solve(A, B)。 我们的问题是 guess @ inputArray = goalArray。 为了匹配 A @ X = B 的形式,我们可以对整个方程进行转置: (guess @ inputArray).T = goalArray.TinputArray.T @ guess.T = goalArray.T 现在,这符合 A @ X = B 的形式,其中 A = inputArray.T,X = guess.T,B = goalArray.T。 因此,guess.T = np.linalg.solve(inputArray.T, goalArray.T)。 最后,将结果转置回来得到 guess: guess = np.linalg.solve(inputArray.T, goalArray.T).T

# 检查inputArray是否可逆
if np.linalg.det(inputArray) != 0:
    # 使用线性代数直接求解
    solution_linalg = np.linalg.solve(inputArray.T, goalArray.T).T
    print("\n--- Solution using Linear Algebra (np.linalg.solve) ---")
    print(f"Directly calculated transformation matrix:\n{solution_linalg}")
    # 验证解的准确性
    calculated_goal = solution_linalg @ inputArray
    print(f"Verifying result (solution_linalg @ inputArray):\n{calculated_goal}")
    print(f"Difference from goalArray (should be close to zero):\n{np.abs(goalArray - calculated_goal).sum():.4f}")
else:
    print("\ninputArray is singular, cannot solve directly using linear algebra.")

这种线性代数方法在 inputArray 非奇异的情况下,通常比迭代优化算法更精确、更快速。它应该作为解决此类特定问题的首选方法。

总结

在Python中使用SciPy进行数值优化时,理解优化函数对输入参数的处理方式至关重要。

  1. 重塑输入: scipy.optimize.fmin 或 scipy.optimize.minimize 会展平初始猜测值。在目标函数内部,务必将展平的数组重塑回其预期的多维形状。
  2. 向量化操作: 充分利用NumPy的向量化能力,用 np.sum, np.abs, np.linalg.norm 等函数替代显式循环,以提高目标函数的计算效率和可读性。
  3. 使用 optimize.minimize: 对于新的优化任务,优先选择 scipy.optimize.minimize。它提供了更现代、更灵活的接口,支持多种优化算法,并返回更详细的优化结果。
  4. 考虑问题本质: 在某些情况下,看似需要优化的任务可能通过更直接的数学方法(如线性代数求解)来解决,这通常会提供更精确和高效的答案。在开始复杂的数值优化之前,分析问题的数学性质是明智之举。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1126

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

192

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1618

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

20

2026.01.19

点击input框没有光标怎么办
点击input框没有光标怎么办

点击input框没有光标的解决办法:1、确认输入框焦点;2、清除浏览器缓存;3、更新浏览器;4、使用JavaScript;5、检查硬件设备;6、检查输入框属性;7、调试JavaScript代码;8、检查页面其他元素;9、考虑浏览器兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

185

2023.11.24

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

407

2023.08.14

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

24

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

7

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

28

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号