
本文深入探讨OptaPlanner的评分机制,重点阐述其硬、中、软分数的层级比较逻辑。我们将揭示为何OptaPlanner会选择包含负分组件的解决方案,以及如何通过精确定义约束权重来确保解决方案符合业务规则和优化目标,从而避免选择不符合预期的结果。
1. OptaPlanner评分机制概述
OptaPlanner在寻找最优解时,通过一个多层级的评分系统来评估每个解决方案的质量。这个评分系统通常由硬分数(Hard Score)、中等分数(Medium Score)和软分数(Soft Score)组成,它们按照从左到右、从硬到软的优先级进行比较。这种层级结构意味着,即使软分数表现不佳,只要硬分数足够优秀,一个解决方案仍可能被认为是更优的。
- 硬分数(Hard Score):代表必须满足的强制性业务规则。任何硬分数上的惩罚都意味着解决方案是无效或不可接受的。通常,目标是使硬分数为零(即0hard)。
- 中等分数(Medium Score):代表次要的业务规则或优化目标,其重要性低于硬分数,但高于软分数。
- 软分数(Soft Score):代表理想的优化目标或偏好,其满足与否不影响解决方案的有效性,但会影响其“好坏”程度。
2. 理解OptaPlanner的层级分数比较逻辑
OptaPlanner在比较两个解决方案的得分时,遵循严格的层级顺序。它首先比较硬分数,如果硬分数不同,则硬分数更高的解决方案被认为是更优的。只有当硬分数完全相同时,才会继续比较中等分数;如果中等分数也相同,则最后比较软分数。
让我们通过一个具体的例子来阐明这一点。假设我们有以下三个解决方案的得分:
- (6hard/-1medium/0soft)
- (5hard/3medium/2soft)
- (1hard/0medium/0soft)
根据OptaPlanner的比较规则,它们的优劣顺序如下:
(6hard/-1medium/0soft) > (5hard/3medium/2soft) > (1hard/0medium/0soft)
解释:
- 6hard vs 5hard vs 1hard: 解决方案1的硬分数是6,高于解决方案2的5,也高于解决方案3的1。因此,即使解决方案1在中等分数上有一个负值(-1medium),它仍然被认为是最好的解决方案,因为它在最重要的硬分数层级上表现最优。
- 5hard vs 1hard: 解决方案2的硬分数是5,高于解决方案3的1。因此,解决方案2优于解决方案3。
这个例子清楚地表明,OptaPlanner并不会因为某个分数组件是负数就“拒绝”一个解决方案。负数仅仅代表了在该层级上的一个惩罚值。如果一个解决方案在更高级别的分数上表现更好,它就会被优先选择,无论其低级别分数是否为负。
3. 如何精确定义约束以实现业务目标
在OptaPlanner中,分数是解决方案质量的直接衡量。如果OptaPlanner选择了您认为“不正确”的解决方案(例如,一个硬分数更高但中分数或软分数有惩罚的方案),这通常意味着您的约束权重或定义需要调整,以更准确地反映您的业务优先级。
要解决“拒绝包含负分组件的解决方案”的需求,您需要将那些“不可接受”的条件提升为硬约束。
步骤与建议:
-
明确“必须满足”的条件为硬约束:
- 任何绝对不能违反的规则,例如“销售代表不能在工作时间之外工作”、“销售代表不能同时处理多个预约”,都应该被定义为硬约束,并施加硬分数惩罚(例如HardSoftScore.ONE_HARD)。
- 如果解决方案违反了这些规则,即使其他方面表现良好,其硬分数也会下降,从而使其在比较中处于劣势。
-
区分“重要但非强制”的条件为中等约束:
- 例如,如果某个条件“最好不要发生,但如果发生了也不是世界末日”,可以将其定义为中等约束。
-
区分“理想偏好”的条件为软约束:
- 例如,“最小化旅行时间”、“优先分配给有经验的销售代表”等,这些是优化目标,但不是强制性的,可以定义为软约束。
-
迭代和测试:
- 约束的定义和权重的分配是一个迭代过程。在实现约束后,务必运行规划器并审查生成的解决方案及其分数,以验证它们是否符合您的预期。
- 如果结果不符合预期,请重新评估您的约束定义和惩罚权重。
示例代码(使用ConstraintFactory):
假设我们有一个销售代表分配预约的场景,我们希望:
- 销售代表不能在非工作时间工作(硬约束)
- 销售代表不能同时处理多个预约(硬约束)
- 尽可能减少销售代表的旅行时间(软约束)
import org.optaplanner.core.api.score.buildin.hardsoft.HardSoftScore;
import org.optaplanner.core.api.score.stream.Constraint;
import org.optaplanner.core.api.score.stream.ConstraintFactory;
import org.optaplanner.core.api.score.stream.Joiners;
public class SalesSchedulingConstraints {
// 假设 Appointment 和 Salesperson 是您的规划实体和规划变量
/**
* 硬约束:销售代表不能在非工作时间处理预约。
* 违反此规则的解决方案是不可接受的。
*/
public Constraint salesRepWorkTiming(ConstraintFactory factory) {
return factory.forEach(Appointment.class)
.filter(appointment -> {
// 假设 appointment.getSalesperson() 和 appointment.getStartTime()
// 以及 Salesperson.isWorkingOutsideHours() 方法已存在
return appointment.getSalesperson() != null &&
appointment.getSalesperson().isWorkingOutsideHours(appointment.getStartTime());
})
.penalize(HardSoftScore.ONE_HARD) // 每次违反扣除1个硬分数
.asConstraint("Sales Rep Work Timing");
}
/**
* 硬约束:销售代表不能同时处理多个预约。
* 违反此规则的解决方案是不可接受的。
*/
public Constraint noConcurrentAppointments(ConstraintFactory factory) {
return factory.forEachUniquePair(Appointment.class,
// 两个预约必须分配给同一个销售代表
Joiners.equal(Appointment::getSalesperson),
// 两个预约的时间段必须重叠
Joiners.overlapping(Appointment::getStartTime, Appointment::getEndTime))
.penalize(HardSoftScore.ONE_HARD) // 每次重叠扣除1个硬分数
.asConstraint("No Concurrent Appointments");
}
/**
* 软约束:最小化销售代表的旅行时间。
* 这是一个优化目标,不是强制性的。
*/
public Constraint minimizeTravelTime(ConstraintFactory factory) {
return factory.forEach(Appointment.class)
.penalize(HardSoftScore.ONE_SOFT,
appointment -> appointment.getTravelTimeInMinutes()) // 根据旅行时间惩罚软分数
.asConstraint("Minimize Travel Time");
}
}在上述示例中,salesRepWorkTiming和noConcurrentAppointments被定义为硬约束。这意味着,如果一个解决方案违反了这些规则,即使其软分数非常高,它也绝不会被认为是优于一个所有硬约束都满足(0hard)的解决方案。
4. 总结
OptaPlanner的评分机制是其核心所在,理解其层级比较逻辑至关重要。分数是解决方案质量的唯一衡量标准,并且OptaPlanner总是致力于找到具有“最佳”分数的解决方案。如果您发现规划器选择了您不希望的方案,问题不在于OptaPlanner“拒绝”或“接受”负分,而在于您的约束定义和权重没有充分反映您的业务优先级。通过将强制性条件明确定义为硬约束,并将优化目标定义为中等或软约束,您可以有效地引导OptaPlanner找到符合您期望的最优解决方案。这是一个持续学习和调整的过程,需要结合业务理解和对OptaPlanner机制的深入掌握。










