標記影像和文字文件
在專案管理員建立 Azure Machine Learning 影像資料標記專案 或 Azure Machine Learning 文字資料標記專案之後,您可以使用標籤工具來快速準備 Machine Learning 專案的資料。 本文章說明:
- 如何存取您的標籤專案
- 標籤工具
- 如何使用特定標籤工作的工具
必要條件
- 組織和專案的 Microsoft 帳戶或 Azure Active Directory 帳戶。
- 包含標籤專案的工作區參與者層級存取權。
登入工作室
選取包含標籤專案的訂用帳戶和工作區。 您的專案管理員具有這項資訊。
視您的存取層級而定,您可能會在左側看到多個區段。 如果您這麼做,請選取左側的 [ 資料標籤 ] 以尋找專案。
了解標籤工作
在資料標記專案資料表中,選取專案的 [ 標籤資料 ] 連結。
您會看到專案專屬的指示。 它們說明涉及的資料類型、您應該如何做出決策,以及其他相關資訊。 閱讀資訊,然後選取頁面頂端的 [ 工作 ]。 您也可以選取頁面底部的 [ 開始標籤 ]。
選取標籤
在所有資料標記工作中,您可以從專案管理員指定的集合中選擇適當的標籤或標籤。 您可以使用鍵盤數位鍵來選取前九個標記。
輔助機器學習
機器學習演算法可以在標記期間觸發。 如果您的專案已啟用這些演算法,您可能會看到:
影像
標示一些資料之後,您可能會在畫面頂端看到 [工作] 叢集 ,位於專案名稱旁。 影像會分組在一起,以在相同的頁面上呈現類似的影像。 若是如此,請切換到多個影像檢視的其中一個,以利用分組功能帶來的好處。
稍後,您可能會在專案名稱旁邊看到 預先標記 的工作。 專案會顯示為機器學習分類模型所產生的建議標籤。 機器學習模型的精確度不會是 100%。 雖然我們只會使用模型確信的資料,但這些資料值可能仍然有不正確的預先標籤。 當您看到標籤時,請在提交頁面之前更正任何錯誤的標籤。
對於物件識別模型,您可能會看到周框方塊和標籤已經存在。 在您提交頁面之前,請更正所有錯誤。
對於分割模型,您可能會看到多邊形和標籤已經存在。 在您提交頁面之前,請更正所有錯誤。
Text
- 最後您可能會在專案名稱旁邊看到 預先標記 的任務。 專案會顯示為機器學習分類模型所產生的建議標籤。 機器學習模型的精確度不會是 100%。 雖然我們只會使用模型確信的資料,但這些資料值可能仍然未正確預先標記。 當您看到這些標籤時,請更正任何錯誤的標籤再提交頁面。
在標籤專案中,機器學習模型可能只有足夠的精確度,才能預先標記小型影像子集。 標記這些影像之後,標籤專案會返回手動標記,以收集下一個模型定型回合的更多資料。 經過一段時間後,模型會更有信心地瞭解較高比例的影像。 稍後在專案中,其信賴度會導致更多的預先標籤工作。
當沒有任何預先標記的工作時,您可以停止確認或更正標籤,並返回手動專案標記。
影像工作
針對影像分類工作,您可以選擇同時檢視多個影像。 使用影像區域上方的圖示來選取版面配置。
若要同時選取所有顯示的影像,請使用 [全選]。 若要選取個別影像,請使用影像右上角的圓形選取按鈕。 您至少須選取一個影像來套用標籤。 如果您選取多個影像,您選取的任何標籤都會套用至所有選取的影像。
在這裡,我們選擇兩個兩個版面配置,並將標籤 「群組」套用至熊和 Orca 影像。 擷取影像已標記為「購物車魚」,且耙假名還沒有標籤。
重要
只有在您有未標記資料的新頁面時,才切換版面配置。 切換版面配置會清除頁面的進行中標記工作。
標記頁面上的所有影像之後,Azure 會啟用 [ 提交 ] 按鈕。 選取 [提交] 以儲存您的工作。
在您提交手邊資料的標籤後,Azure 會以工作佇列中的一組新影像來重新整理頁面。
醫療影像工作
重要
標記 DICOM 或類似影像類型的功能不是旨在用作醫療裝置、臨床支援、診斷工具,或其他旨在用於診斷、醫治、緩解、治療或預防疾病或其他狀況的技術,而且 Microsoft 不會授與任何授權或權限,將這項功能用於這類目的。 這項功能不是旨在實作或部署為替代專業醫療建議,或醫療保健專業人員的醫療保健意見、診斷、治療或臨床判斷,而且也不應該如此使用。 若對 DICOM 或類似影像類型使用資料標記,這完全是客戶的責任。
影像專案支援 X 光檔案影像的 DICOM 影像格式。
當您使用與任何其他影像相同的工具為醫療影像加上標籤時,您可以針對 DICOM 影像使用不同的工具。 選取 [視窗和層級] 工具來變更影像的強度。 此工具僅適用於 DICOM 影像。
標記影像以進行多類別分類
針對「影像分類多類別」專案類型,將單一標記指派給整個影像。 若要隨時檢閱指示,請移至 [ 指示 ] 頁面,然後選取 [ 檢視詳細指示]。
如果您在將標籤指派給影像之後發現作業有誤,您可加以修正。 選取影像下方標籤上的 「X」,以清除標籤。 您也可以選取影像,然後選擇另一個類別。 新選取的值會取代先前套用的標記。
標記影像以進行多標籤分類
如果您的專案類型為「影像分類多標籤」,您可以將一 或多個 標籤套用至影像。 若要查看專案特定的指示,請選取 [ 指示],然後移至 [檢視詳細指示]。
選取您要加上標籤的影像,然後選取標籤。 標籤會套用到所有選取的影像,然後影像會取消選取。 若要套用更多標籤,您必須重新選擇影像。 下列動畫顯示多標籤的標記:
- 使用 [全選] 套用「海洋」標籤。
- 選取單一影像,並將其標記為「特寫」。
- 選取三個影像,並將其標記為「廣角」。
若要更正錯誤,請選取 「X」 以清除個別標籤,或選取影像,然後選取標籤,以清除所有選取影像中的標記。 此案例如下所示。 選取 [Land] 會從兩個選取的影像清除該標籤。
只有在您將至少一個標籤套用至每個影像之後,Azure 才會啟用 [ 提交 ] 按鈕。 選取 [提交] 以儲存您的工作。
標記影像並指定週框方塊以進行物件偵測
如果您的專案類型為「物件識別 (周框方塊) 」,您可以在影像中指定一或多個周框方塊,並將標籤套用至每個方塊。 影像可以有多個週框方塊,而每個方塊分別有單一標籤。 使用 [檢視詳細指示 ] 來判斷您的專案是否使用多個周框方塊。
- 針對您打算建立的周框方塊選取標籤。
- 選取矩形
,或選取 [R]。
- 選取並對角拖曳目標,以建立粗略周框方塊。 拖曳邊緣或角落以調整周框方塊。
若要刪除週框方塊,請在建立之後,選取出現在週框方塊旁的 X 形目標。
您無法變更現有週框方塊的標籤。 若要修正標記指派錯誤,您必須刪除周框方塊,並建立具有正確標籤的新方塊。
根據預設,您可以編輯現有的週框方塊。 鎖定/解除鎖定區域工具或 "L" 會切換該行為。 如果區域已鎖定,您就只能變更新週框方塊的形狀或位置。
使用區域操作或 「M」,以調整現有的周框方塊。 拖曳邊緣或角落,以調整形狀。 如果您想要拖曳整個周框方塊,請在內部選取 。 如果您無法編輯區域,您可能已切換 鎖定/解除鎖定區域 工具。
使用 範本型方 塊 或 「T」,建立相同大小的多個周框方塊。 如果影像沒有周框方塊,而且您啟用以範本為基礎的方塊,此工具會產生 50 到 50 圖元的方塊。 如果您建立周框方塊,然後啟用以範本為基礎的方塊,則任何新的周框方塊的大小符合您建立的最後一個方塊大小。 範本型方塊在放置後可調整大小。 調整範本型方塊的大小時,只會調整特定方塊的大小。
若要刪除目前影像中的「所有」週框方塊,請選取刪除所有區域工具。
建立影像的周框方塊後,請選取 [提交] 以儲存您的工作,否則進行中的工作將不會儲存。
標記影像並指定影像分割的多邊形
如果您的專案類型為「實例分割 (Polygon) 」,請在影像中指定一或多個多邊形,並將標籤套用至每個多邊形。 影像可以有多個週框多邊形,而每個多邊形分別有單一標記。 使用 [檢視詳細指示 ] 來判斷您的專案是否使用多個周框多邊形。
為您要建立的週框多邊形選取標記。
選取 [繪製多邊形區域 ]
,或選取 [P]。
選取多邊形的每個點。 當您完成圖形時,按兩下即可完成。
若要刪除多邊形,請在建立之後,選取出現在多邊形旁的 X 形目標。
若要變更多邊形的標籤,請選取 [移動區域 ] 工具、選取多邊形,然後選取正確的標籤。
您可以編輯現有的多邊形。 鎖定/解除鎖定區域工具使用,或 「L」 會切換該行為。 如果區域已鎖定,您就只能變更新多邊形的形狀或位置。
使用 [新增或移除多邊形點 ] 工具 或 「U」,可調整現有的多邊形。 選取多邊形以新增或移除點。 如果您無法編輯區域,您可能已切換 鎖定/解除鎖定區域 工具。
若要刪除目前影像中的「所有」多邊形,請選取刪除所有區域工具。
建立影像的多邊形之後,請選取 [提交] 以儲存您的工作,否則進行中的工作將不會儲存。
標籤文字
標記文字時,請使用工具列:
- 增加或減少文字大小
- 變更字型
- 略過標記此項目並移至下一個項目
如果您認為在指派標籤後犯錯,則可以修正該錯誤。 在顯示於文字下方的標籤上選取 "X",以清除標籤。
有三種文字專案類型:
專案類型 | 描述 |
---|---|
分類多類別 | 將單一標記指派給整個文字項目。 您只能為每個文字項目選取一個標籤。 選取標籤,然後選取 [ 提交 ] 以移至下一個專案。 |
分類多標籤 | 將一或「多個」標記指派給每個文字項目。 您可以為每個文字項目選取多個標籤。 選取所有套用的標籤,然後選取 [ 提交 ] 以移至下一個專案。 |
具名實體辨識 | 標記每個文字項目中的不同單字或片語。 請參閱下一節中的指示。 |
若要查看專案特定的指示,請選取 [ 指示],然後移至 [檢視詳細指示]。
標記單字和片語
如果專案是為具名實體辨識而設定,請標記每個文字項目中的不同單字或片語。 若要標記文字:
- 選取標籤,或輸入對應至適當標籤的數位
- 按兩下單字,或使用滑鼠來選取多個單字。
若要變更標籤,您可以:
- 刪除標籤並重新開始。
- 變更目前專案中部分或所有特定標籤的值:
- 選取標籤本身,這會選取該標籤的所有實例。
- 在此標籤的實例上再次選取,取消選取您想要保留的任何實例。
- 最後,選取新的標籤,以變更仍選取的所有標籤。
標記專案中的所有專案之後,請選取 [ 提交 ] 以移至下一個專案。
完成
當您提交已標記資料的頁面時,Azure 會為您指派工作佇列中未標記的新資料。 如果沒有其他未標記的資料可用,新的訊息會指出,以及入口網站首頁的連結。
當您完成標籤時,請在 Studio 右上角的圓形內選取您的影像,然後選取 [登出]。如果您未登出,最終 Azure 將會「逾時」,並將您的資料指派給另一個標籤器。