图像分割技术是将图像划分为多个具有独特属性的区域,并从中提取感兴趣目标的过程。它是图像处理向图像分析过渡的关键步骤。目前,图像分割方法主要包括基于阈值的分割、基于区域的分割、基于边缘的分割以及基于特定理论的分割等。从数学角度来看,图像分割是将数字图像划分为互不相交的区域的过程,同时也是一个标记过程,即将同一区域的像素赋予相同的编号。
为了解决传统的GrabCut和GraphCut算法需要用户提供精确的前景和背景种子,且种子覆盖不全时分割准确度受影响的问题,微软研究室提出了更为高效的GrabCut分割算法。GrabCut算法只需用户提供一个包含前景的矩形区域,矩形外的区域被视为背景。具体步骤如下:
- 将矩形外的像素标记为背景,矩形内的像素标记为前景,并使用这些标记来训练背景和前景的高斯混合模型(GMM);
- 使用训练好的GMM计算每个像素属于背景或前景的概率,从而计算能量函数中的Data项,Smoothness项的计算方法与GraphCut类似;
- 通过优化能量函数获得图像的一个分割结果;
- 使用步骤3中的分割结果重新训练前景和背景的GMM;
- 重复步骤2、3、4,直到分割结果收敛(不再有显著变化)。
从上述步骤可以看出,GrabCut是一个通过循环执行来实现EM(期望最大化)算法的过程。由于用户提供的矩形内可能包含部分背景像素,因此初始种子可能不完全准确。然而,GMM模型不需要所有训练数据都正确,即使部分分类错误,也可以通过EM步骤达到正确的最终结果。GrabCut正是利用了GMM的这一特性。不过需要注意的是,GMM存在陷入局部最优解的问题,GrabCut也同样面临这一挑战。
算法论文的地址为:https://www.php.cn/link/ec6019ea251a4e03b08d4135153be64e
API代码语言为JavaScript,代码运行次数为0。以下是API的代码示例:
public static void grabCut(Mat img, Mat mask, Rect rect, Mat bgdModel, Mat fgdModel, int iterCount, int mode)
参数说明如下:
- 参数一:
img
,输入的待分割图像,必须是8位三通道图像。 - 参数二:
mask
,输入/输出8位单通道掩码图像。像素值及其含义如下:GC_BGD(0)表示明显的背景像素,GC_FGD(1)表示明显的前景像素,GC_PR_BGD(2)表示可能的背景像素,GC_PR_FGD(3)表示可能的前景像素。 - 参数三:
rect
,包含细分对象的ROI区域。ROI外的区域被标记为“明显的背景”。当第七个参数mode
为GC_INIT_WITH_RECT时,该参数才会被使用。 - 参数四:
bgdModel
,前景模型临时对象。处理同一图像时,请勿对其进行修改。 - 参数五:
fgdModel
,背景模型临时对象。处理同一图像时,请勿对其进行修改。 - 参数六:
iterCount
,迭代次数。可以通过使用mode == GC_INIT_WITH_MASK
或mode == GC_EVAL
进行进一步调用来完善结果。 - 参数七:
mode
,分割模式标志位。标志位值及其含义如下:GC_INIT_WITH_RECT(0)表示使用提供的矩形初始化状态和掩码,之后根据算法进行迭代更新;GC_INIT_WITH_MASK(1)表示使用提供的掩码初始化状态,可以组合使用GC_INIT_WITH_RECT和GC_INIT_WITH_MASK,然后使用GC_BGD自动初始化ROI之外的所有像素;GC_EVAL(2)表示算法应该恢复;GC_EVAL_FREEZE_MODEL(3)表示算法仅在固定模型下运行GrabCut算法(单次迭代)。
以下是JavaScript代码示例:
/**
* 图像分割 Grabcut
* author: yidong
* 2020/11/21
*/
class GrabcutActivity extends AppCompatActivity {
private val mBinding: ActivityGrabcutBinding by lazy {
ActivityGrabcutBinding.inflate(layoutInflater)
}
private lateinit var mRgb: Mat
override fun onCreate(savedInstanceState: Bundle?) {
super.onCreate(savedInstanceState)
setContentView(mBinding.root)
val bgr = Utils.loadResource(this, R.drawable.lena)
mRgb = Mat()
Imgproc.cvtColor(bgr, mRgb, Imgproc.COLOR_BGR2RGB)
mBinding.ivLena.showMat(mRgb)
GlobalScope.launch(Dispatchers.IO) {
doGrabCut()
}
}
private fun doGrabCut() {
val rectMat = Mat()
mRgb.copyTo(rectMat)
val rect = Rect(80, 30, 340, 390)
Imgproc.rectangle(rectMat, rect, Scalar.all(255.0), 2)
GlobalScope.launch(Dispatchers.Main) {
mBinding.ivLena.showMat(rectMat)
}
val bgdModel = Mat.zeros(1, 65, CvType.CV_64FC1)
val fgdModel = Mat.zeros(1, 65, CvType.CV_64FC1)
val mask = Mat.zeros(mRgb.size(), CvType.CV_8UC1)
Imgproc.grabCut(mRgb, mask, rect, bgdModel, fgdModel, 5, Imgproc.GC_INIT_WITH_RECT)
val result = Mat()
for (i in 0 until mask.rows()) {
for (j in 0 until mask.cols()) {
val value = mask.get(i, j)[0].toInt()
if (value == 1 || value == 3) {
mask.put(i, j, 255.0)
} else {
mask.put(i, j, 0.0)
}
}
}
Core.bitwise_and(mRgb, mRgb, result, mask)
GlobalScope.launch(Dispatchers.Main) {
mBinding.ivResult.showMat(result)
}
}
override fun onDestroy() {
mRgb.release()
super.onDestroy()
}}
效果图如下:


源码地址:https://www.php.cn/link/cf3df6fa1165f1ceaa6c246e9d7d0492










