你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

ROIPooling

    ROIPooling (input,
                ROIs,
                {ROI output shape}, 
                spatialScale = {spatial scale wrt image (float)})

ROI 池操作通过为每个感兴趣的区域选择最大 (最大池) 值来计算新矩阵, (ROI) 。 将感兴趣的区域作为运算符的第二个输入作为原始图像的绝对像素的区域左上角和右下角。 池输入按 ROI 计算,方法是将坐标投影到输入特征图上, (运算符的第一个输入) 并考虑所有重叠位置。 投影使用“空间刻度”,即输入特征映射与输入图像大小的大小比率。 空间刻度可以通过乘以在 ROI 池之前发生的所有步幅并采用反乘,例如,具有四个池层且步幅为 2 的网络将空间刻度为 1/16。 输出形状的宽度和高度由第三个参数确定,输出深度 () 的筛选器数与输入深度相同。

  • input - 整个映像的池输入
  • ROIs - ROI 坐标作为绝对像素坐标 (x_min, y_min, x_max, y_max)
  • {roi output shape}- 维度 (宽度、高度) ROI 输出,例如,作为 BrainScript 向量。 (4:4)
  • spatialScale - 原始图像大小的操作数比例。 默认值为 1/16,与 AlexNet 和 VGG16 网络等匹配。

注意

CNTK版本 2.1 中更改。

在 CNTK 2.1 中,添加了空间刻度参数,并且 ROIS 的坐标现在作为绝对像素值传递,而不是与以前版本中的相对值一样。