Etykietowanie obrazów i dokumentów tekstowych

Gdy administrator projektu utworzy projekt etykietowania danych obrazu lub projekt etykietowania danych tekstowych w usłudze Azure Machine Learning, możesz użyć narzędzia etykietowania, aby szybko przygotować dane do projektu usługi Machine Learning. W tym artykule opisano:

  • Jak uzyskać dostęp do projektów etykietowania
  • Narzędzia do etykietowania
  • Jak używać narzędzi do określonych zadań etykietowania

Wymagania wstępne

  • Konto Microsoft lub konto usługi Azure Active Directory dla organizacji i projektu.
  • Dostęp na poziomie współautora do obszaru roboczego zawierającego projekt etykietowania.

Zaloguj się do studia

  1. Zaloguj się do Azure Machine Learning studio.

  2. Wybierz subskrypcję i obszar roboczy zawierający projekt etykietowania. Uzyskaj te informacje od administratora projektu.

  3. W zależności od poziomu dostępu może być widocznych wiele sekcji po lewej stronie. Jeśli tak, wybierz pozycję Etykietowanie danych po lewej stronie, aby znaleźć projekt.

Omówienie zadania etykietowania

W tabeli projektów etykietowania danych wybierz link Etykieta danych dla projektu.

Zostaną wyświetlone instrukcje specyficzne dla projektu. Wyjaśniają one typ danych, które masz do czynienia, sposób podejmowania decyzji oraz inne istotne informacje. Po przeczytaniu tych informacji w górnej części strony wybierz pozycję Zadania. W dolnej części strony wybierz pozycję Rozpocznij etykietowanie.

Wybieranie etykiety

We wszystkich zadaniach etykietowania danych wybierasz odpowiedni tag lub tagi z zestawu określonego przez administratora projektu. Możesz wybrać pierwsze dziewięć tagów przy użyciu klawiszy liczbowych na klawiaturze.

Wspomagane uczenie maszynowe

Algorytmy uczenia maszynowego mogą być wyzwalane podczas etykietowania. Jeśli te algorytmy są włączone w projekcie, mogą zostać wyświetlone następujące elementy:

  • Obrazy

    • Po oznaczeniu pewnej ilości danych w górnej części ekranu obok nazwy projektu może zostać wyświetlony komunikat Zadania klastrowane w górnej części ekranu. Oznacza to, że obrazy są pogrupowane razem w celu prezentowania podobnych obrazów na tej samej stronie. Jeśli tak, przełącz się na jeden z wielu widoków obrazów, aby skorzystać z grupowania.

    • W późniejszym momencie obok nazwy projektu może pojawić się prelabelowane zadania . Elementy zostaną wyświetlone z sugerowaną etykietą pochodzącą z modelu klasyfikacji uczenia maszynowego. Żaden model uczenia maszynowego nie ma dokładności 100%. Chociaż używamy tylko danych, dla których model jest pewny siebie, te dane mogą nadal być niepoprawnie wstępniebelowane. Po wyświetleniu etykiet popraw wszelkie nieprawidłowe etykiety przed przesłaniem strony.

    • W przypadku modeli identyfikacji obiektów można zobaczyć pola ograniczenia i etykiety już obecne. Popraw wszystkie nieprawidłowe karty przed przesłaniem strony.

    • W przypadku modeli segmentacji mogą być widoczne już wielokąty i etykiety. Popraw wszystkie nieprawidłowe karty przed przesłaniem strony.

  • Tekst

    • W pewnym momencie obok nazwy projektu może być widoczna wstępnie etykieta Zadania . Elementy zostaną wyświetlone z sugerowaną etykietą pochodzącą z modelu klasyfikacji uczenia maszynowego. Żaden model uczenia maszynowego nie ma dokładności 100%. Chociaż używamy tylko danych, dla których model jest pewny siebie, te dane mogą nadal być niepoprawnie wstępniebelowane. Po wyświetleniu etykiet popraw wszelkie nieprawidłowe etykiety przed przesłaniem strony.

Szczególnie wcześnie w projekcie etykietowania model uczenia maszynowego może być wystarczająco dokładny, aby wstępnie oznaczyć mały podzestaw obrazów. Po oznaczeniu tych obrazów projekt etykietowania powróci do ręcznego etykietowania, aby zebrać więcej danych na potrzeby następnej rundy trenowania modelu. W miarę upływu czasu model stanie się bardziej pewny proporcji obrazów, co spowoduje zwiększenie liczby zadań prelabelowych w dalszej części projektu.

Jeśli nie ma już wstępnie utworzonych zadań, przestaniesz potwierdzać lub poprawiać etykiety i wrócić do ręcznego tagowania elementów.

Zadania obrazów

W przypadku zadań klasyfikacji obrazów można jednocześnie wyświetlać wiele obrazów. Użyj ikon nad obszarem obrazu, aby wybrać układ.

Aby jednocześnie wybrać wszystkie wyświetlane obrazy, użyj pozycji Wybierz wszystko. Aby wybrać poszczególne obrazy, użyj przycisku wyboru cyklicznego w prawym górnym rogu obrazu. Aby zastosować tag, musisz wybrać co najmniej jeden obraz. Jeśli wybierzesz wiele obrazów, dowolny wybrany tag zostanie zastosowany do wszystkich wybranych obrazów.

W tym miejscu wybraliśmy układ dwa po dwa i zamierzamy zastosować tag "Ssak" do obrazów niedźwiedzia i orki. Obraz rekina został już oznaczony jako "Cartilaginous fish", a iguana nie została jeszcze otagowana.

Wiele układów obrazów i zaznaczenia

Ważne

Przełączaj układy tylko wtedy, gdy masz nową stronę danych bez etykiet. Przełączanie układów usuwa pracę tagowania strony w toku.

Platforma Azure włącza przycisk Prześlij po oznaczeniu wszystkich obrazów na stronie. Wybierz pozycję Prześlij, aby zapisać pracę.

Po przesłaniu tagów dla danych platforma Azure odświeża stronę przy użyciu nowego zestawu obrazów z kolejki roboczej.

Zadania obrazów medycznych

Ważne

Możliwość etykietowania DICOM lub podobnych typów obrazów nie jest przeznaczona ani udostępniana jako urządzenie medyczne, wsparcie kliniczne, narzędzie diagnostyczne lub inne technologie przeznaczone do stosowania w diagnozie, leczeniu, leczeniu lub zapobieganiu chorobom lub innym warunkom, a żadne licencje lub prawa nie są przyznawane przez Microsoft do korzystania z tej możliwości w takich celach. Ta możliwość nie jest zaprojektowana ani przeznaczona do wdrożenia lub wdrożona jako substytut profesjonalnej porady medycznej lub opinii medycznej, diagnostyki, leczenia lub osądu klinicznego pracownika służby zdrowia i nie powinna być wykorzystywana jako taka. Klient ponosi wyłączną odpowiedzialność za korzystanie z etykietowania danych dla modelu DICOM lub podobnych typów obrazów.

Projekty obrazów obsługują format obrazu DICOM dla obrazów plików rentgenowskich.

Obraz DICOM promienia rentgenowskiego, który ma być oznaczony etykietą.

Podczas etykietowania obrazów medycznych z tymi samymi narzędziami co inne obrazy, istnieje dodatkowe narzędzie do obrazów DICOM. Wybierz narzędzie Okno i poziom , aby zmienić intensywność obrazu. To narzędzie jest dostępne tylko dla obrazów DICOM.

Narzędzie okna i poziomu dla obrazów DICOM.

Tagowanie obrazów na potrzeby klasyfikacji z wieloma klasami

Jeśli projekt ma typ "Klasyfikacja obrazów Wieloklasowa", przypiszesz pojedynczy tag do całego obrazu. Aby przejrzeć wskazówki w dowolnym momencie, przejdź do strony Instrukcje i wybierz pozycję Wyświetl szczegółowe instrukcje.

Jeśli zdasz sobie sprawę, że popełnisz błąd po przypisaniu tagu do obrazu, możesz go naprawić. Wybierz znak "X" na etykiecie wyświetlanej poniżej obrazu, aby wyczyścić tag. Możesz też wybrać obraz i wybrać inną klasę. Nowo wybrana wartość zastąpi wcześniej zastosowany tag.

Tagowanie obrazów na potrzeby klasyfikacji z wieloma etykietami

Jeśli pracujesz nad projektem typu "Multi-Label klasyfikacji obrazów", zastosujesz jeden lub więcej tagów do obrazu. Aby wyświetlić wskazówki dotyczące projektu, wybierz pozycję Instrukcje i przejdź do pozycji Wyświetl szczegółowe instrukcje.

Wybierz obraz, który chcesz oznaczyć etykietą, a następnie wybierz tag. Tag jest stosowany do wszystkich zaznaczonych obrazów, a następnie obrazy są zaznaczone. Aby zastosować więcej tagów, należy ponownie zaznaczyć obrazy. Poniższa animacja przedstawia tagowanie z wieloma etykietami:

  1. Wybierz wszystko , aby zastosować tag "Ocean".
  2. Wybrano pojedynczy obraz i oznaczono je tagiem "Zamknij".
  3. Wybrano trzy obrazy i oznaczono je tagiem "Szeroki kąt".

Animacja pokazuje przepływ wieloznakowy

Aby naprawić błąd, wybierz znak "X", aby wyczyścić pojedynczy tag lub wybrać obrazy, a następnie wybrać tag, który czyści tag ze wszystkich wybranych obrazów. Ten scenariusz jest pokazany tutaj. Wybranie pozycji "Land" spowoduje wyczyszczenie tego tagu z dwóch wybranych obrazów.

Zrzut ekranu przedstawiający wiele deselections

Platforma Azure włączy tylko przycisk Prześlij po zastosowaniu co najmniej jednego tagu do każdego obrazu. Wybierz pozycję Prześlij, aby zapisać pracę.

Tagowanie obrazów i określanie pól ograniczeń na potrzeby wykrywania obiektów

Jeśli projekt ma typ "Identyfikacja obiektu (pola ograniczenia)," określisz co najmniej jedno pole ograniczenia na obrazie i zastosujesz tag do każdego pola. Obrazy mogą zawierać wiele pól ograniczenia, z których każdy ma jeden tag. Użyj opcji Wyświetl szczegółowe instrukcje , aby określić, czy w projekcie jest używanych wiele pól ograniczenia.

  1. Wybierz tag pola ograniczenia, które chcesz utworzyć.
  2. Wybierz narzędzie prostokątne pole prostokątne lub wybierz pozycję "R".
  3. Zaznacz i przeciągnij po przekątnej w całym obiekcie docelowym, aby utworzyć przybliżone pole ograniczenia. Aby dostosować pole ograniczenia, przeciągnij krawędzie lub rogi.

Tworzenie pola ograniczenia

Aby usunąć pole ograniczenia, wybierz obiekt docelowy w kształcie X, który pojawi się obok pola ograniczenia po utworzeniu.

Nie można zmienić tagu istniejącego pola ograniczenia. Jeśli popełnisz błąd przypisania tagów, musisz usunąć pole ograniczenia i utworzyć nowy z poprawnym tagiem.

Domyślnie można edytować istniejące pola ograniczenia. Narzędzie Blokada/odblokowywanie regionów Blokuje/odblokowywanie regionów lub "L" przełącza to zachowanie. Jeśli regiony są zablokowane, można zmienić kształt lub lokalizację nowego pola ograniczenia.

Użyj narzędzia do manipulowania regionami Jest to ikona narzędzia do manipulowania regionami — cztery strzałki wskazujące na zewnątrz z środka, w górę, w prawo, w dół i w lewo. Lub "M" w celu dostosowania istniejącego pola ograniczenia. Przeciągnij krawędzie lub rogi, aby dostosować kształt. Zaznacz wnętrze, aby móc przeciągać całe pole ograniczenia. Jeśli nie możesz edytować regionu, prawdopodobnie włączono narzędzie Regiony blokady/odblokowywania .

Użyj narzędzia szablonubox tool Template-box lub "T", aby utworzyć wiele pól ograniczenia o tym samym rozmiarze. Jeśli obraz nie ma pól ograniczenia i uaktywnisz pola oparte na szablonach, narzędzie utworzy 50-do 50-pikselowych pól. W przypadku utworzenia pola ograniczenia, a następnie aktywowania pól opartych na szablonach wszystkie nowe pola ograniczenia będą rozmiarem ostatniego utworzonego pola. Pola oparte na szablonach można zmienić po umieszczeniu. Zmiana rozmiaru pola opartego na szablonie zmienia rozmiar tylko tego konkretnego pola.

Aby usunąć wszystkie pola ograniczenia na bieżącym obrazie, wybierz narzędzie Usuń wszystkie regiony Narzędzie Usuńregiony Usuń regiony.

Po utworzeniu pól ograniczenia dla obrazu wybierz pozycję Prześlij , aby zapisać pracę lub praca w toku nie zostanie zapisana.

Tagowanie obrazów i określanie wielokątów dla segmentacji obrazów

Jeśli projekt ma typ "Segmentacja wystąpienia (wielokąt)," określisz co najmniej jeden wielokąt na obrazie i zastosujesz tag do każdego wielokąta. Obrazy mogą mieć wiele wielokątów ograniczenia, z których każdy ma jeden tag. Użyj opcji Wyświetl szczegółowe instrukcje , aby określić, czy w projekcie jest używanych wiele wielokątów ograniczenia.

  1. Wybierz tag dla wielokąta, który chcesz utworzyć.

  2. Wybierz narzędzie Rysowanie regionu wielokątowego Rysuj region wielokątny lub wybierz pozycję "P".

  3. Wybierz dla każdego punktu w wielokącie. Po zakończeniu kształtu kliknij dwukrotnie, aby zakończyć.

    Tworzenie wielokątów dla kotów i psa

Aby usunąć wielokąt, wybierz obiekt docelowy w kształcie X, który pojawia się obok wielokąta po utworzeniu.

Jeśli chcesz zmienić tag dla wielokąta, wybierz narzędzie Przenieś region , wybierz wielokąt i wybierz prawidłowy tag.

Istniejące wielokąty można edytować. Narzędzie Blokowanie/odblokowywanie regionówEdytuj wielokąty za pomocą narzędzia regionów blokady/odblokowywania lub "L" przełącza to zachowanie. Jeśli regiony są zablokowane, można zmienić kształt lub lokalizację nowego wielokąta.

Użyj narzędzia Dodaj lub usuń punkty wielokątne. Jest to ikona narzędzia dodawania lub usuwania punktów wielokątnych lub "U", aby dostosować istniejący wielokąt. Wybierz wielokąt, aby dodać lub usunąć punkt. Jeśli nie możesz edytować regionu, prawdopodobnie włączono narzędzie Regiony blokady/odblokowywania .

Aby usunąć wszystkie wielokąty na bieżącym obrazie, wybierz narzędzie Usuń wszystkie regiony Usuńwszystkie regiony.

Po utworzeniu wielokątów obrazu wybierz pozycję Prześlij , aby zapisać pracę, lub praca w toku nie zostanie zapisana.

Tekst etykiety

Podczas tagowania tekstu użyj paska narzędzi, aby:

  • Zwiększ lub zmniejsz rozmiar tekstu
  • Zmienianie czcionki
  • Pomiń etykietowanie tego elementu i przejdź do następnego elementu

Jeśli zdajesz sobie sprawę, że popełnisz błąd po przypisaniu tagu, możesz go naprawić. Wybierz znak "X" na etykiecie wyświetlanej poniżej tekstu, aby wyczyścić tag.

Istnieją trzy typy projektów tekstowych:

Project type (Typ projektu) Opis
Klasyfikacja wieloklasowa Przypisz pojedynczy tag do całego wpisu tekstowego. Można wybrać tylko jeden tag dla każdego elementu tekstowego. Wybierz tag, a następnie wybierz pozycję Prześlij , aby przejść do następnego wpisu.
Klasyfikacja — wiele etykiet Przypisz jeden lub więcej tagów do każdego wpisu tekstowego. Możesz wybrać wiele tagów dla każdego elementu tekstowego. Wybierz wszystkie tagi, które mają zastosowanie, a następnie wybierz pozycję Prześlij , aby przejść do następnego wpisu.
Rozpoznawanie jednostek nazwanych Oznacz różne wyrazy lub frazy w każdym wpisie tekstowym. Zobacz wskazówki w poniższej sekcji.

Aby wyświetlić wskazówki dotyczące projektu, wybierz pozycję Instrukcje i przejdź do pozycji Wyświetl szczegółowe instrukcje.

Tagowanie wyrazów i fraz

Jeśli projekt jest skonfigurowany do rozpoznawania nazwanych jednostek, oznaczasz różne wyrazy lub frazy w każdym elemencie tekstowym. Aby oznaczyć tekst:

  1. Wybierz etykietę lub wpisz numer odpowiadający odpowiedniej etykiecie
  2. Kliknij dwukrotnie wyraz lub użyj myszy, aby wybrać wiele słów.

Zrzut ekranu: rozpoznawanie jednostek nazwanych.

Aby zmienić etykietę, możesz:

  • Usuń etykietę i uruchom ponownie.
  • Zmień wartość dla wszystkich lub niektórych określonej etykiety w bieżącym elemencie:
    • Wybierz samą etykietę, która wybierze wszystkie wystąpienia tej etykiety.
    • Wybierz ponownie wystąpienia tej etykiety, aby usunąć zaznaczenie wszystkich wystąpień, których nie chcesz zmieniać.
    • Na koniec wybierz nową etykietę, aby zmienić wszystkie wybrane etykiety.

Po oznaczeniu wszystkich elementów w wpisie wybierz pozycję Prześlij , aby przejść do następnego wpisu.

Kończenie

Po przesłaniu strony otagowanych danych platforma Azure przypisuje do Ciebie nowe niezaznaczone dane z kolejki roboczej. Jeśli nie ma już dostępnych danych bez etykiet, zostanie wyświetlony komunikat informujący o tym wraz z linkiem do strony głównej portalu.

Po zakończeniu etykietowania wybierz obraz wewnątrz okręgu w prawym górnym rogu studia, a następnie wybierz pozycję Wyloguj się. Jeśli nie wylogujesz się, w końcu platforma Azure "upłynął limit czasu" i przypisze dane do innego labelera.

Następne kroki