標記影像和文字文件

在專案管理員建立 Azure Machine Learning 影像資料標記專案 或 Azure Machine Learning 文字資料標記專案之後,您可以使用標籤工具來快速準備 Machine Learning 專案的資料。 本文章說明:

  • 如何存取您的標籤專案
  • 標籤工具
  • 如何使用特定標籤工作的工具

必要條件

  • 組織和專案的 Microsoft 帳戶或 Azure Active Directory 帳戶。
  • 包含標籤專案的工作區參與者層級存取權。

登入工作室

  1. 登入 Azure Machine Learning Studio

  2. 選取包含標籤專案的訂用帳戶和工作區。 您的專案管理員具有這項資訊。

  3. 視您的存取層級而定,您可能會在左側看到多個區段。 如果您這麼做,請選取左側的 [ 資料標籤 ] 以尋找專案。

了解標籤工作

在資料標記專案資料表中,選取專案的 [ 標籤資料 ] 連結。

您會看到專案專屬的指示。 它們說明涉及的資料類型、您應該如何做出決策,以及其他相關資訊。 閱讀資訊,然後選取頁面頂端的 [ 工作 ]。 您也可以選取頁面底部的 [ 開始標籤 ]。

選取標籤

在所有資料標記工作中,您可以從專案管理員指定的集合中選擇適當的標籤或標籤。 您可以使用鍵盤數位鍵來選取前九個標記。

輔助機器學習

機器學習演算法可以在標記期間觸發。 如果您的專案已啟用這些演算法,您可能會看到:

  • 影像

    • 標示一些資料之後,您可能會在畫面頂端看到 [工作] 叢集 ,位於專案名稱旁。 影像會分組在一起,以在相同的頁面上呈現類似的影像。 若是如此,請切換到多個影像檢視的其中一個,以利用分組功能帶來的好處。

    • 稍後,您可能會在專案名稱旁邊看到 預先標記 的工作。 專案會顯示為機器學習分類模型所產生的建議標籤。 機器學習模型的精確度不會是 100%。 雖然我們只會使用模型確信的資料,但這些資料值可能仍然有不正確的預先標籤。 當您看到標籤時,請在提交頁面之前更正任何錯誤的標籤。

    • 對於物件識別模型,您可能會看到周框方塊和標籤已經存在。 在您提交頁面之前,請更正所有錯誤。

    • 對於分割模型,您可能會看到多邊形和標籤已經存在。 在您提交頁面之前,請更正所有錯誤。

  • Text

    • 最後您可能會在專案名稱旁邊看到 預先標記 的任務。 專案會顯示為機器學習分類模型所產生的建議標籤。 機器學習模型的精確度不會是 100%。 雖然我們只會使用模型確信的資料,但這些資料值可能仍然未正確預先標記。 當您看到這些標籤時,請更正任何錯誤的標籤再提交頁面。

在標籤專案中,機器學習模型可能只有足夠的精確度,才能預先標記小型影像子集。 標記這些影像之後,標籤專案會返回手動標記,以收集下一個模型定型回合的更多資料。 經過一段時間後,模型會更有信心地瞭解較高比例的影像。 稍後在專案中,其信賴度會導致更多的預先標籤工作。

當沒有任何預先標記的工作時,您可以停止確認或更正標籤,並返回手動專案標記。

影像工作

針對影像分類工作,您可以選擇同時檢視多個影像。 使用影像區域上方的圖示來選取版面配置。

若要同時選取所有顯示的影像,請使用 [全選]。 若要選取個別影像,請使用影像右上角的圓形選取按鈕。 您至少須選取一個影像來套用標籤。 如果您選取多個影像,您選取的任何標籤都會套用至所有選取的影像。

在這裡,我們選擇兩個兩個版面配置,並將標籤 「群組」套用至熊和 Orca 影像。 擷取影像已標記為「購物車魚」,且耙假名還沒有標籤。

多個影像版面配置和選取項目

重要

只有在您有未標記資料的新頁面時,才切換版面配置。 切換版面配置會清除頁面的進行中標記工作。

標記頁面上的所有影像之後,Azure 會啟用 [ 提交 ] 按鈕。 選取 [提交] 以儲存您的工作。

在您提交手邊資料的標籤後,Azure 會以工作佇列中的一組新影像來重新整理頁面。

醫療影像工作

重要

標記 DICOM 或類似影像類型的功能不是旨在用作醫療裝置、臨床支援、診斷工具,或其他旨在用於診斷、醫治、緩解、治療或預防疾病或其他狀況的技術,而且 Microsoft 不會授與任何授權或權限,將這項功能用於這類目的。 這項功能不是旨在實作或部署為替代專業醫療建議,或醫療保健專業人員的醫療保健意見、診斷、治療或臨床判斷,而且也不應該如此使用。 若對 DICOM 或類似影像類型使用資料標記,這完全是客戶的責任。

影像專案支援 X 光檔案影像的 DICOM 影像格式。

要標記的 X 光 DICOM 影像。

當您使用與任何其他影像相同的工具為醫療影像加上標籤時,您可以針對 DICOM 影像使用不同的工具。 選取 [視窗和層級] 工具來變更影像的強度。 此工具僅適用於 DICOM 影像。

DICOM 影像的窗口和平整工具。

標記影像以進行多類別分類

針對「影像分類多類別」專案類型,將單一標記指派給整個影像。 若要隨時檢閱指示,請移至 [ 指示 ] 頁面,然後選取 [ 檢視詳細指示]。

如果您在將標籤指派給影像之後發現作業有誤,您可加以修正。 選取影像下方標籤上的 「X」,以清除標籤。 您也可以選取影像,然後選擇另一個類別。 新選取的值會取代先前套用的標記。

標記影像以進行多標籤分類

如果您的專案類型為「影像分類多標籤」,您可以將一 或多個 標籤套用至影像。 若要查看專案特定的指示,請選取 [ 指示],然後移至 [檢視詳細指示]。

選取您要加上標籤的影像,然後選取標籤。 標籤會套用到所有選取的影像,然後影像會取消選取。 若要套用更多標籤,您必須重新選擇影像。 下列動畫顯示多標籤的標記:

  1. 使用 [全選] 套用「海洋」標籤。
  2. 選取單一影像,並將其標記為「特寫」。
  3. 選取三個影像,並將其標記為「廣角」。

顯示多標籤流程的動畫

若要更正錯誤,請選取 「X」 以清除個別標籤,或選取影像,然後選取標籤,以清除所有選取影像中的標記。 此案例如下所示。 選取 [Land] 會從兩個選取的影像清除該標籤。

顯示多個取消選取項目的螢幕擷取畫面

只有在您將至少一個標籤套用至每個影像之後,Azure 才會啟用 [ 提交 ] 按鈕。 選取 [提交] 以儲存您的工作。

標記影像並指定週框方塊以進行物件偵測

如果您的專案類型為「物件識別 (周框方塊) 」,您可以在影像中指定一或多個周框方塊,並將標籤套用至每個方塊。 影像可以有多個週框方塊,而每個方塊分別有單一標籤。 使用 [檢視詳細指示 ] 來判斷您的專案是否使用多個周框方塊。

  1. 針對您打算建立的周框方塊選取標籤。
  2. 選取矩形方塊工具矩形方塊工具,或選取 [R]。
  3. 選取並對角拖曳目標,以建立粗略周框方塊。 拖曳邊緣或角落以調整周框方塊。

周框方塊建立

若要刪除週框方塊,請在建立之後,選取出現在週框方塊旁的 X 形目標。

您無法變更現有週框方塊的標籤。 若要修正標記指派錯誤,您必須刪除周框方塊,並建立具有正確標籤的新方塊。

根據預設,您可以編輯現有的週框方塊。 鎖定/解除鎖定區域工具鎖定/解除鎖定區域工具或 "L" 會切換該行為。 如果區域已鎖定,您就只能變更新週框方塊的形狀或位置。

使用區域操作工具 這是區域操作工具圖示 - 四個箭號從中央、向上、向右、向下和向左指向,或 「M」,以調整現有的周框方塊。 拖曳邊緣或角落,以調整形狀。 如果您想要拖曳整個周框方塊,請在內部選取 。 如果您無法編輯區域,您可能已切換 鎖定/解除鎖定區域 工具。

使用 範本型方工具 Template-box 工具或 「T」,建立相同大小的多個周框方塊。 如果影像沒有周框方塊,而且您啟用以範本為基礎的方塊,此工具會產生 50 到 50 圖元的方塊。 如果您建立周框方塊,然後啟用以範本為基礎的方塊,則任何新的周框方塊的大小符合您建立的最後一個方塊大小。 範本型方塊在放置後可調整大小。 調整範本型方塊的大小時,只會調整特定方塊的大小。

若要刪除目前影像中的「所有」週框方塊,請選取刪除所有區域工具刪除區域工具

建立影像的周框方塊後,請選取 [提交] 以儲存您的工作,否則進行中的工作將不會儲存。

標記影像並指定影像分割的多邊形

如果您的專案類型為「實例分割 (Polygon) 」,請在影像中指定一或多個多邊形,並將標籤套用至每個多邊形。 影像可以有多個週框多邊形,而每個多邊形分別有單一標記。 使用 [檢視詳細指示 ] 來判斷您的專案是否使用多個周框多邊形。

  1. 為您要建立的週框多邊形選取標記。

  2. 選取 [繪製多邊形區域 ] 工具 [繪製多邊形區域] 工具,或選取 [P]。

  3. 選取多邊形的每個點。 當您完成圖形時,按兩下即可完成。

    建立適用於貓和狗的多邊形

若要刪除多邊形,請在建立之後,選取出現在多邊形旁的 X 形目標。

若要變更多邊形的標籤,請選取 [移動區域 ] 工具、選取多邊形,然後選取正確的標籤。

您可以編輯現有的多邊形。 鎖定/解除鎖定區域工具使用鎖定/解除鎖定區域工具編輯多邊形,或 「L」 會切換該行為。 如果區域已鎖定,您就只能變更新多邊形的形狀或位置。

使用 [新增或移除多邊形點 ] 工具 這是新增或移除多邊形點工具圖示。或 「U」,可調整現有的多邊形。 選取多邊形以新增或移除點。 如果您無法編輯區域,您可能已切換 鎖定/解除鎖定區域 工具。

若要刪除目前影像中的「所有」多邊形,請選取刪除所有區域工具刪除所有區域工具

建立影像的多邊形之後,請選取 [提交] 以儲存您的工作,否則進行中的工作將不會儲存。

標籤文字

標記文字時,請使用工具列:

  • 增加或減少文字大小
  • 變更字型
  • 略過標記此項目並移至下一個項目

如果您認為在指派標籤後犯錯,則可以修正該錯誤。 在顯示於文字下方的標籤上選取 "X",以清除標籤。

有三種文字專案類型:

專案類型 描述
分類多類別 將單一標記指派給整個文字項目。 您只能為每個文字項目選取一個標籤。 選取標籤,然後選取 [ 提交 ] 以移至下一個專案。
分類多標籤 將一或「多個」標記指派給每個文字項目。 您可以為每個文字項目選取多個標籤。 選取所有套用的標籤,然後選取 [ 提交 ] 以移至下一個專案。
具名實體辨識 標記每個文字項目中的不同單字或片語。 請參閱下一節中的指示。

若要查看專案特定的指示,請選取 [ 指示],然後移至 [檢視詳細指示]。

標記單字和片語

如果專案是為具名實體辨識而設定,請標記每個文字項目中的不同單字或片語。 若要標記文字:

  1. 選取標籤,或輸入對應至適當標籤的數位
  2. 按兩下單字,或使用滑鼠來選取多個單字。

螢幕擷取畫面:具名實體辨識。

若要變更標籤,您可以:

  • 刪除標籤並重新開始。
  • 變更目前專案中部分或所有特定標籤的值:
    • 選取標籤本身,這會選取該標籤的所有實例。
    • 在此標籤的實例上再次選取,取消選取您想要保留的任何實例。
    • 最後,選取新的標籤,以變更仍選取的所有標籤。

標記專案中的所有專案之後,請選取 [ 提交 ] 以移至下一個專案。

完成

當您提交已標記資料的頁面時,Azure 會為您指派工作佇列中未標記的新資料。 如果沒有其他未標記的資料可用,新的訊息會指出,以及入口網站首頁的連結。

當您完成標籤時,請在 Studio 右上角的圓形內選取您的影像,然後選取 [登出]。如果您未登出,最終 Azure 將會「逾時」,並將您的資料指派給另一個標籤器。

後續步驟