
本文详解为何看似正确的类别分配约束仍导致pulp模型判定为不可行,并通过引入最小化最大类别负载的目标函数,提供可解、鲁棒且易于扩展的整数规划建模方案。
在使用PuLP等工具求解“将N个带价格的物品分配至M个有预算上限的类别”问题时,一个常见误区是:仅添加可行性约束而未设置目标函数,或目标函数设计不当,导致求解器无法找到可行解,甚至误判问题本身不可行。您提供的原始代码正是典型情况——虽然约束逻辑(每个物品恰好分入一类、每类总价格不超限)完全正确,但PuLP默认以最大化目标函数求解,而您的模型未调用 model.setObjective(),此时PuLP会尝试最大化零目标(即 0),这在数学上虽合法,却可能触发求解器内部启发式策略失效,尤其当约束边界紧、数值尺度差异大时(如示例中存在 0.0 与超260万的价格),极易返回 Infeasible 状态。
根本原因在于:无目标函数的纯可行性问题,在实际求解中常需依赖求解器的“可行性泵”或辅助变量技巧;而直接赋予一个合理目标,既能引导搜索方向,又能天然规避数值退化风险。推荐采用「最小化所有类别中最大的已分配金额」(min-max)策略——它不仅确保问题必有解(只要总预算 ≥ 总价格),还能均衡负载、提升解的实用性。
以下为优化后的完整实现(基于 pandas + PuLP,结构清晰、数值稳健):
用最优化方法解决最优化问题的技术称为最优化技术,它包含两个方面的内容: 1) 建立数学模型 即用数学语言来描述最优化问题。模型中的数学关系式反映了最优化问题所要达到的目标和各种约束条件。 2) 数学求解 数学模型建好以后,选择合理的最优化方法进行求解。 利用Matlab的优化工具箱,可以求解线性规划、非线性规划和多目标规划问题。具体而言,包括线性、非线性最小化,最大最小化,二次规划,半无限问题,线性、非线性方程(组)的求解,线性、非线性的最小二乘问题。另外,该工具箱还提供了线性、非线性最小化,方程求解,
import pandas as pd
import pulp
def assign_items_to_categories(
item_prices: pd.Series,
cat_limits: pd.Series,
) -> tuple[pd.DataFrame, pd.Series]:
"""
将物品分配至预算受限的类别,最小化最大类别负载(均衡分配)
Parameters:
-----------
item_prices : pd.Series, index=items, values=price
cat_limits : pd.Series, index=categories, values=limit
Returns:
--------
assign : pd.DataFrame, shape (n_categories, n_items), binary assignment
subtotals : pd.Series, index=categories, actual allocated sum per category
"""
model = pulp.LpProblem("Assign_Items_to_Categories", sense=pulp.LpMinimize)
# 决策变量:assign[cat, item] = 1 表示 item 分配给 cat
assign = pd.DataFrame(
data=pulp.LpVariable.matrix(
name='assign', cat=pulp.LpBinary,
indices=(cat_limits.index, item_prices.index),
),
index=cat_limits.index,
columns=item_prices.index,
)
# 辅助连续变量:tmax = 所有类别中最大的已分配金额
tmax = pulp.LpVariable('tmax', lowBound=0, cat=pulp.LpContinuous)
# 约束1:每个物品必须且只能分配给一个类别
for item in item_prices.index:
model.addConstraint(
pulp.lpSum(assign.loc[:, item]) == 1,
name=f'excl_{item}'
)
# 约束2:每类总价格 ≤ 其预算上限
# 约束3:每类总价格 ≤ tmax(使 tmax 成为上界)
subtotals = assign @ item_prices # 向量化计算每类总和
for cat in cat_limits.index:
model.addConstraint(
subtotals[cat] <= cat_limits[cat],
name=f'limit_{cat}'
)
model.addConstraint(
subtotals[cat] <= tmax,
name=f'tmax_{cat}'
)
# 目标:最小化 tmax → 即最小化最重负载类别
model.setObjective(tmax)
# 求解(建议启用日志查看过程)
model.solve(pulp.PULP_CBC_CMD(msg=True))
if model.status != pulp.LpStatusOptimal:
raise RuntimeError(f"Model unsolved: {pulp.LpStatus[model.status]}")
# 提取结果
assign_result = assign.map(pulp.value).round().astype(int)
subtotals_result = subtotals.apply(pulp.value)
return assign_result, subtotals_result
# 示例数据(修复原代码中的拼写错误:cateogory_limit → category_limit)
if __name__ == "__main__":
prices = pd.Series(
data=[0.0, 2_616_023.02, 367_419.34, 676_545.32, 228_518.29],
index=['0892ADA75MH1-00', '3WR21137BHJ81', '3137344ABHEX1',
'2312312AAWW31-1', '313243A8WTQV1'],
name='price'
)
category_limits = pd.Series(
data=[2_754_707.42, 43_002.21, 240_301.31, 500_432.54, 3_100_233.41],
index=['APPLE', 'META', 'TESLA', 'NETFLIX', 'GOOGLE'],
name='limit'
)
assignment, loads = assign_items_to_categories(prices, category_limits)
print("各品类实际负载:")
print(loads.round(2))
print("\n分配矩阵(行=品类,列=物品):")
print(assignment.T) # 转置以便按物品查看归属关键改进与注意事项:
- ✅ 强制设定目标函数:model.setObjective(tmax) 是模型可解的核心保障,避免“无目标”导致的求解器行为不确定;
- ✅ 向量化建模:使用 pandas.DataFrame 和 @ 运算符替代嵌套循环,大幅提升可读性与维护性;
- ✅ 数值稳定性处理:lowBound=0 显式约束 tmax 非负,避免浮点误差引发异常;
- ⚠️ 检查总预算充足性:运行前建议验证 sum(item_prices)
- ⚠️ 类别名称一致性:原代码中 cateogory_limit 拼写错误,务必确保键名与 categories 列表完全匹配;
- ? 调试技巧:调用 model.writeLP("debug.lp") 生成 .lp 文件,用文本编辑器人工检查约束是否符合预期。
该方案不仅解决了“不可行”报错,更将问题升级为一个具有实际业务意义的负载均衡优化问题——所得解既满足全部硬约束,又尽可能避免单点过载,是生产环境中更优的选择。









