Sdílet prostřednictvím


RoIPooling

    ROIPooling (input,
                ROIs,
                {ROI output shape}, 
                spatialScale = {spatial scale wrt image (float)})

Operace sdružování roI vypočítá novou matici výběrem maximální hodnoty (maximálního sdružování) ve vstupu sdružování pro každou oblast zájmu (ROI). Oblasti zájmu se pro operátor zadávají jako druhý vstup jako levý horní a pravý dolní roh oblastí v absolutních pixelech původního obrázku. Vstup ve fondu se vypočítá na hodnotu ROI tak, že promítá souřadnice na mapu vstupních funkcí (první vstup operátoru) a vezme v úvahu všechny překrývající se pozice. Projekce používá prostorové měřítko, což je poměr velikosti vstupní mapy funkcí oproti velikosti vstupního obrázku. Prostorové měřítko je možné vypočítat vynásobením všech kroků, ke kterým dochází před sdružováním roI, a převzetím inverzní oblasti, například sítí, která má čtyři vrstvy sdružování se dvěma kroky, by měla prostorové měřítko 1/16. Šířku a výšku výstupního obrazce určuje třetí argument, výstupní hloubka (počet filtrů) je stejná jako vstupní hloubka.

  • input - sdružování vstupu pro celý obrázek
  • ROIs - Souřadnice ROI jako absolutní souřadnice pixelů (x_min, y_min, x_max, y_max)
  • {roi output shape} - rozměry (šířka, výška) výstupu ROI jako vektor BrainScriptu, např. (4:4).
  • spatialScale - měřítko operandu z původní velikosti obrázku. Výchozí hodnota je 1/16, která odpovídá například sítím AlexNet a VGG16.

Poznámka

Změna v CNTK verze 2.1

V CNTK 2.1 byl přidán parametr prostorového měřítka a souřadnice ROI se nyní předávají jako absolutní hodnoty pixelů, nikoli jako relativní hodnoty jako v předchozích verzích.