Udostępnij za pośrednictwem


Osadzanie na platformie .NET

Osadzanie to sposób, w jaki llMs przechwytują znaczenie semantyczne. Są to reprezentacje liczbowe danych nieliczbowych, których usługa LLM może używać do określania relacji między pojęciami. Za pomocą osadzania można pomóc modelowi sztucznej inteligencji zrozumieć znaczenie danych wejściowych, dzięki czemu może wykonywać porównania i przekształcenia, takie jak podsumowywanie tekstu lub tworzenie obrazów na podstawie opisów tekstu. LlMs mogą używać osadzania natychmiast i można przechowywać osadzania w wektorowych bazach danych w celu zapewnienia semantycznej pamięci dla llMs zgodnie z potrzebami.

Przypadki użycia osadzania

W tej sekcji wymieniono główne przypadki użycia osadzania.

Używanie własnych danych w celu zwiększenia istotności uzupełniania

Użyj własnych baz danych, aby wygenerować osadzanie dla danych i zintegrować je z modułem LLM, aby udostępnić je do ukończenia. To zastosowanie osadzania jest ważnym składnikiem generowania rozszerzonego pobierania.

Zwiększ ilość tekstu, który można zmieścić w wierszu polecenia

Użyj osadzeń, aby zwiększyć ilość kontekstu, który można zmieścić w wierszu polecenia bez zwiększania wymaganej liczby tokenów.

Załóżmy na przykład, że chcesz dołączyć 500 stron tekstu w wierszu polecenia. Liczba tokenów dla tego dużo nieprzetworzonego tekstu przekroczy limit tokenu wejściowego, co uniemożliwia bezpośrednie uwzględnienie w wierszu polecenia. Za pomocą osadzania można podsumować i podzielić duże ilości tego tekstu na fragmenty, które są wystarczająco małe, aby zmieścić się w jednym wejściu, a następnie ocenić podobieństwo każdego elementu do całego nieprzetworzonego tekstu. Następnie możesz wybrać fragment, który najlepiej zachowuje semantyczne znaczenie nieprzetworzonego tekstu i używać go w wierszu polecenia bez osiągnięcia limitu tokenu.

Wykonywanie klasyfikacji tekstu, podsumowania lub tłumaczenia

Osadzanie ułatwia modelowi zrozumienie znaczenia i kontekstu tekstu, a następnie klasyfikowanie, podsumowywanie lub tłumaczenie tego tekstu. Na przykład możesz użyć osadzeń, aby ułatwić modelom klasyfikowanie tekstów jako pozytywnych lub negatywnych, niepożądanych, niepożądanych, a nie niepożądanych, wiadomości lub opinii.

Generowanie i transkrypcja dźwięku

Osadzanie audio umożliwia przetwarzanie plików dźwiękowych lub danych wejściowych w aplikacji.

Na przykład usługa mowa obsługuje szereg osadzania audio, w tym zamianę mowy na tekst i zamianę tekstu na mowę. Dźwięk można przetwarzać w czasie rzeczywistym lub w partiach.

Przekształcanie tekstu w obrazy lub obrazy w tekst

Przetwarzanie obrazów semantycznych wymaga osadzania obrazów, których większość llM nie może wygenerować. Użyj modelu osadzania obrazów, takiego jak ViT , aby utworzyć wektorowe osadzanie obrazów. Następnie można użyć tych osadzania z modelem generowania obrazów, aby utworzyć lub zmodyfikować obrazy przy użyciu tekstu lub odwrotnie. Na przykład możesz użyć języka DALL· Model E do generowania obrazów , takich jak logo, twarze, zwierzęta i krajobrazy.

Generowanie lub kod dokumentu

Osadzanie ułatwia modelowi tworzenie kodu na podstawie tekstu lub odwrotnie przez konwertowanie różnych wyrażeń kodu lub tekstu na wspólną reprezentację. Na przykład możesz użyć osadzania, aby ułatwić generowanie modelu lub kod dokumentu w języku C# lub Python.

Wybieranie modelu osadzania

Osadzanie danych pierwotnych jest generowane przy użyciu modelu osadzania sztucznej inteligencji, który może kodować dane nieliczbowe do wektora (długa tablica liczb). Model może również dekodować osadzanie w danych nieliczbowych, które mają takie samo lub podobne znaczenie jak oryginalne, nieprzetworzone dane. Istnieje wiele modeli osadzania, których można używać, a model openAI text-embedding-ada-002 jest jednym z typowych modeli, które są używane. Aby uzyskać więcej przykładów, zobacz listę modeli osadzania dostępnych w usłudze Azure OpenAI.

Przechowywanie i przetwarzanie osadzania w bazie danych wektorów

Po wygenerowaniu osadzania będzie potrzebny sposób ich przechowywania, aby później można było pobrać je z wywołaniami do usługi LLM. Bazy danych wektorów są przeznaczone do przechowywania i przetwarzania wektorów, więc są one naturalnym domem dla osadzania. Różne wektorowe bazy danych oferują różne możliwości przetwarzania, dlatego należy wybrać jedną na podstawie danych pierwotnych i celów. Aby uzyskać informacje o opcjach, zobacz dostępne rozwiązania bazy danych wektorów.

Korzystanie z osadzania w rozwiązaniu LLM

Podczas kompilowania aplikacji opartych na języku LLM można użyć jądra semantycznego, aby zintegrować modele osadzania i magazyny wektorów, dzięki czemu można szybko ściągać dane tekstowe i generować i przechowywać osadzanie. Dzięki temu można użyć rozwiązania wektorowej bazy danych do przechowywania i pobierania pamięci semantycznych.