セマンティックカーネルでのテキスト埋め込みの生成

2025-03-06

テキスト埋め込みの生成では、AI モデルを使用してベクター (埋め込みとも呼ばれる) を生成できます。これらのベクトルは、元のテキストの類似性を比較するために 2 つのベクトルで数式を使用できるように、テキストのセマンティック意味をエンコードします。これは、ユーザークエリに関連するテキストの情報のデータベースを検索する検索拡張生成 (RAG) などのシナリオに役立ちます。一致する情報をチャット完了への入力として提供し、AI モデルがユーザークエリに応答するときのコンテキストを増やすことができます。

埋め込みモデルを選択する場合は、次の点を考慮する必要があります。

モデルによって生成されるベクターのサイズは何ですか。これはベクターストレージコストに影響を与えるので、構成可能です。
生成されたベクターに含まれる要素の種類 (float32、float16 など) は、ベクターストレージコストに影響します。
ベクターの生成速度はどのくらいですか?
生成コストはどのくらいですか?

ヒント

ベクターの格納と検索の詳細については、「セマンティックカーネルベクターストアコネクタとは」を参照してください。

ヒント

セマンティックカーネルでベクターストアで RAG を使用する方法の詳細については、「セマンティックカーネルテキスト検索でベクターストアを使用する方法」と「セマンティックカーネルテキスト検索プラグインとは」を参照してください。

ローカル環境の設定

一部の AI サービスはローカルでホストでき、一部のセットアップが必要になる場合があります。これをサポートするユーザー向けの手順を次に示します。

ローカルセットアップなし。

Docker を使用して Ollama をローカルで実行するには、次のコマンドを使用して、CPU を使用してコンテナーを開始します。

docker run -d -v "c:\temp\ollama:/root/.ollama" -p 11434:11434 --name ollama ollama/ollama

Docker を使用して Ollama をローカルで実行するには、次のコマンドを使用して、GPU を使用してコンテナーを開始します。

docker run -d --gpus=all -v "c:\temp\ollama:/root/.ollama" -p 11434:11434 --name ollama ollama/ollama

コンテナーが開始されたら、Docker コンテナーのターミナルウィンドウを起動します。たとえば、docker desktop を使用している場合は、アクションから Open in Terminal を選択します。

このターミナルから必要なモデルをダウンロードします。たとえば、ここでは mxbai-embed-large 埋め込みモデルをダウンロードします。

ollama pull mxbai-embed-large

使用する ONNX モデルを含むリポジトリを複製します。

git clone https://huggingface.co/TaylorAI/bge-micro-v2

必要なパッケージのインストール

カーネルに埋め込み世代を追加する前に、必要なパッケージをインストールする必要があります。 AI サービスプロバイダーごとにインストールする必要があるパッケージを次に示します。

dotnet add package Microsoft.SemanticKernel.Connectors.AzureOpenAI

dotnet add package Microsoft.SemanticKernel.Connectors.OpenAI

dotnet add package Microsoft.SemanticKernel.Connectors.MistralAI --prerelease

dotnet add package Microsoft.SemanticKernel.Connectors.Google --prerelease

dotnet add package Microsoft.SemanticKernel.Connectors.HuggingFace --prerelease

dotnet add package Microsoft.SemanticKernel.Connectors.Ollama --prerelease

dotnet add package Microsoft.SemanticKernel.Connectors.Onnx --prerelease

テキスト埋め込み生成サービスの作成

必要なパッケージをインストールしたので、テキスト埋め込み生成サービスを作成できます。セマンティックカーネルを使用して埋め込み生成サービスをテキストで作成する方法を次に示します。

カーネルに直接追加する

テキスト埋め込み生成サービスを追加するには、次のコードを使用してカーネルの内部サービスプロバイダーに追加します。

大事な

Azure OpenAI 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0010を追加する必要があります。

using Microsoft.SemanticKernel;

#pragma warning disable SKEXP0010
IKernelBuilder kernelBuilder = Kernel.CreateBuilder();
kernelBuilder.AddAzureOpenAITextEmbeddingGeneration(
    deploymentName: "NAME_OF_YOUR_DEPLOYMENT", // Name of deployment, e.g. "text-embedding-ada-002".
    endpoint: "YOUR_AZURE_ENDPOINT",           // Name of Azure OpenAI service endpoint, e.g. https://myaiservice.openai.azure.com.
    apiKey: "YOUR_API_KEY",
    modelId: "MODEL_ID",          // Optional name of the underlying model if the deployment name doesn't match the model name, e.g. text-embedding-ada-002.
    serviceId: "YOUR_SERVICE_ID", // Optional; for targeting specific services within Semantic Kernel.
    httpClient: new HttpClient(), // Optional; if not provided, the HttpClient from the kernel will be used.
    dimensions: 1536              // Optional number of dimensions to generate embeddings with.
);
Kernel kernel = kernelBuilder.Build();

重要

OpenAI 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0010を追加する必要があります。

using Microsoft.SemanticKernel;

#pragma warning disable SKEXP0010
IKernelBuilder kernelBuilder = Kernel.CreateBuilder();
kernelBuilder.AddOpenAITextEmbeddingGeneration(
    modelId: "MODEL_ID",          // Name of the embedding model, e.g. "text-embedding-ada-002".
    apiKey: "YOUR_API_KEY",
    orgId: "YOUR_ORG_ID",         // Optional organization id.
    serviceId: "YOUR_SERVICE_ID", // Optional; for targeting specific services within Semantic Kernel
    httpClient: new HttpClient(), // Optional; if not provided, the HttpClient from the kernel will be used
    dimensions: 1536              // Optional number of dimensions to generate embeddings with.
);
Kernel kernel = kernelBuilder.Build();

大事な

現在、Mistral 埋め込み生成コネクタは試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;

#pragma warning disable SKEXP0070
IKernelBuilder kernelBuilder = Kernel.CreateBuilder();
kernelBuilder.AddMistralTextEmbeddingGeneration(
    modelId: "NAME_OF_MODEL",           // Name of the embedding model, e.g. "mistral-embed".
    apiKey: "API_KEY",
    endpoint: new Uri("YOUR_ENDPOINT"), // Optional uri endpoint including the port where MistralAI server is hosted. Default is https://api.mistral.ai.
    serviceId: "SERVICE_ID",            // Optional; for targeting specific services within Semantic Kernel
    httpClient: new HttpClient()        // Optional; for customizing HTTP client
);
Kernel kernel = kernelBuilder.Build();

大事な

Google 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.Google;

#pragma warning disable SKEXP0070
IKernelBuilder kernelBuilder = Kernel.CreateBuilder();
kernelBuilder.AddGoogleAIEmbeddingGeneration(
    modelId: "NAME_OF_MODEL",       // Name of the embedding model, e.g. "models/text-embedding-004".
    apiKey: "API_KEY",
    apiVersion: GoogleAIVersion.V1, // Optional
    serviceId: "SERVICE_ID",        // Optional; for targeting specific services within Semantic Kernel
    httpClient: new HttpClient()    // Optional; for customizing HTTP client
);
Kernel kernel = kernelBuilder.Build();

大事な

Hugging Face 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;

#pragma warning disable SKEXP0070
IKernelBuilder kernelBuilder = Kernel.CreateBuilder();
kernelBuilder.AddHuggingFaceTextEmbeddingGeneration(
    model: "NAME_OF_MODEL",             // Name of the embedding model.
    apiKey: "API_KEY",
    endpoint: new Uri("YOUR_ENDPOINT"), // Optional
    serviceId: "SERVICE_ID",            // Optional; for targeting specific services within Semantic Kernel
    httpClient: new HttpClient()        // Optional; for customizing HTTP client
);
Kernel kernel = kernelBuilder.Build();

大事な

Ollama 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;

#pragma warning disable SKEXP0070
IKernelBuilder kernelBuilder = Kernel.CreateBuilder();
kernelBuilder.AddOllamaTextEmbeddingGeneration(
    modelId: "NAME_OF_MODEL",           // E.g. "mxbai-embed-large" if mxbai-embed-large was downloaded as described above.
    endpoint: new Uri("YOUR_ENDPOINT"), // E.g. "http://localhost:11434" if Ollama has been started in docker as described above.
    serviceId: "SERVICE_ID"             // Optional; for targeting specific services within Semantic Kernel
);
Kernel kernel = kernelBuilder.Build();

大事な

ONNX 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;

#pragma warning disable SKEXP0070
IKernelBuilder kernelBuilder = Kernel.CreateBuilder();
kernelBuilder.AddBertOnnxTextEmbeddingGeneration(
    onnxModelPath: "PATH_ON_DISK",       // Path to the model on disk e.g. C:\Repos\huggingface\microsoft\TaylorAI\bge-micro-v2\onnx\model.onnx
    vocabPath: "VOCABULARY_PATH_ON_DISK",// Path to the vocabulary file on disk, e.g. C:\Repos\huggingface\TailorAI\bge-micro-v2\vocab.txt
    serviceId: "SERVICE_ID"              // Optional; for targeting specific services within Semantic Kernel
);
Kernel kernel = kernelBuilder.Build();

依存性注入の使用

依存関係の挿入を使用している場合は、テキスト埋め込み生成サービスをサービスプロバイダーに直接追加する必要があります。これは、埋め込み生成サービスのシングルトンを作成し、それらを一時的なカーネルで再利用する場合に役立ちます。

大事な

Azure OpenAI 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0010を追加する必要があります。

using Microsoft.SemanticKernel;

var builder = Host.CreateApplicationBuilder(args);

#pragma warning disable SKEXP0010
builder.Services.AddAzureOpenAITextEmbeddingGeneration(
    deploymentName: "NAME_OF_YOUR_DEPLOYMENT", // Name of deployment, e.g. "text-embedding-ada-002".
    endpoint: "YOUR_AZURE_ENDPOINT",           // Name of Azure OpenAI service endpoint, e.g. https://myaiservice.openai.azure.com.
    apiKey: "YOUR_API_KEY",
    modelId: "MODEL_ID",          // Optional name of the underlying model if the deployment name doesn't match the model name, e.g. text-embedding-ada-002.
    serviceId: "YOUR_SERVICE_ID", // Optional; for targeting specific services within Semantic Kernel.
    dimensions: 1536              // Optional number of dimensions to generate embeddings with.
);

builder.Services.AddTransient((serviceProvider)=> {
    return new Kernel(serviceProvider);
});

大事な

OpenAI 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0010を追加する必要があります。

using Microsoft.SemanticKernel;

#pragma warning disable SKEXP0010
var builder = Host.CreateApplicationBuilder(args);
builder.Services.AddOpenAITextEmbeddingGeneration(
    modelId: "MODEL_ID",          // Name of the embedding model, e.g. "text-embedding-ada-002".
    apiKey: "YOUR_API_KEY",
    orgId: "YOUR_ORG_ID",         // Optional organization id.
    serviceId: "YOUR_SERVICE_ID", // Optional; for targeting specific services within Semantic Kernel
    dimensions: 1536              // Optional number of dimensions to generate embeddings with.
);

builder.Services.AddTransient((serviceProvider)=> {
    return new Kernel(serviceProvider);
});

大事な

現在、Mistral 埋め込み生成コネクタは試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;

var builder = Host.CreateApplicationBuilder(args);

#pragma warning disable SKEXP0070
builder.Services.AddMistralTextEmbeddingGeneration(
    modelId: "NAME_OF_MODEL",           // Name of the embedding model, e.g. "mistral-embed".
    apiKey: "API_KEY",
    endpoint: new Uri("YOUR_ENDPOINT"), // Optional uri endpoint including the port where MistralAI server is hosted. Default is https://api.mistral.ai.
    serviceId: "SERVICE_ID"             // Optional; for targeting specific services within Semantic Kernel
);

builder.Services.AddTransient((serviceProvider)=> {
    return new Kernel(serviceProvider);
});

大事な

Google 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.Google;

var builder = Host.CreateApplicationBuilder(args);

#pragma warning disable SKEXP0070
builder.Services.AddGoogleAIEmbeddingGeneration(
    modelId: "NAME_OF_MODEL",       // Name of the embedding model, e.g. "models/text-embedding-004".
    apiKey: "API_KEY",
    apiVersion: GoogleAIVersion.V1, // Optional
    serviceId: "SERVICE_ID"         // Optional; for targeting specific services within Semantic Kernel
);

builder.Services.AddTransient((serviceProvider)=> {
    return new Kernel(serviceProvider);
});

大事な

Hugging Face 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;

var builder = Host.CreateApplicationBuilder(args);

#pragma warning disable SKEXP0070
builder.Services.AddHuggingFaceTextEmbeddingGeneration(
    model: "NAME_OF_MODEL",             // Name of the embedding model.
    apiKey: "API_KEY",
    endpoint: new Uri("YOUR_ENDPOINT"), // Optional
    serviceId: "SERVICE_ID",            // Optional; for targeting specific services within Semantic Kernel
    httpClient: new HttpClient()        // Optional; for customizing HTTP client
);

builder.Services.AddTransient((serviceProvider)=> {
    return new Kernel(serviceProvider);
});

大事な

Ollama 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;

var builder = Host.CreateApplicationBuilder(args);

#pragma warning disable SKEXP0070
builder.Services.AddOllamaTextEmbeddingGeneration(
    modelId: "NAME_OF_MODEL",           // E.g. "mxbai-embed-large" if mxbai-embed-large was downloaded as described above.
    endpoint: new Uri("YOUR_ENDPOINT"), // E.g. "http://localhost:11434" if Ollama has been started in docker as described above.
    serviceId: "SERVICE_ID"             // Optional; for targeting specific services within Semantic Kernel
);

builder.Services.AddTransient((serviceProvider)=> {
    return new Kernel(serviceProvider);
});

重要

ONNX 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel;

var builder = Host.CreateApplicationBuilder(args);

#pragma warning disable SKEXP0070
builder.Services.AddBertOnnxTextEmbeddingGeneration(
    onnxModelPath: "PATH_ON_DISK",       // Path to the model on disk e.g. C:\Repos\huggingface\microsoft\TaylorAI\bge-micro-v2\onnx\model.onnx
    vocabPath: "VOCABULARY_PATH_ON_DISK",// Path to the vocabulary file on disk, e.g. C:\Repos\huggingface\TailorAI\bge-micro-v2\vocab.txt
    serviceId: "SERVICE_ID"              // Optional; for targeting specific services within Semantic Kernel
);

builder.Services.AddTransient((serviceProvider)=> {
    return new Kernel(serviceProvider);
});

スタンドアロンインスタンスの作成

最後に、サービスのインスタンスを直接作成して、後でカーネルに追加するか、カーネルまたはサービスプロバイダーに挿入することなく、コードで直接使用することができます。

大事な

Azure OpenAI 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0010を追加する必要があります。

using Microsoft.SemanticKernel.Connectors.AzureOpenAI;

#pragma warning disable SKEXP0010
AzureOpenAITextEmbeddingGenerationService textEmbeddingGenerationService = new (
    deploymentName: "NAME_OF_YOUR_DEPLOYMENT", // Name of deployment, e.g. "text-embedding-ada-002".
    endpoint: "YOUR_AZURE_ENDPOINT",           // Name of Azure OpenAI service endpoint, e.g. https://myaiservice.openai.azure.com.
    apiKey: "YOUR_API_KEY",
    modelId: "MODEL_ID",          // Optional name of the underlying model if the deployment name doesn't match the model name, e.g. text-embedding-ada-002.
    httpClient: new HttpClient(), // Optional; if not provided, the HttpClient from the kernel will be used.
    dimensions: 1536              // Optional number of dimensions to generate embeddings with.
);

大事な

OpenAI 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0010を追加する必要があります。

#pragma warning disable SKEXP0010
using Microsoft.SemanticKernel.Connectors.OpenAI;
OpenAITextEmbeddingGenerationService textEmbeddingGenerationService = new (
    modelId: "MODEL_ID",          // Name of the embedding model, e.g. "text-embedding-ada-002".
    apiKey: "YOUR_API_KEY",
    organization: "YOUR_ORG_ID",  // Optional organization id.
    httpClient: new HttpClient(), // Optional; if not provided, the HttpClient from the kernel will be used
    dimensions: 1536              // Optional number of dimensions to generate embeddings with.
);

大事な

現在、Mistral 埋め込み生成コネクタは試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel.Connectors.MistralAI;

#pragma warning disable SKEXP0070
MistralAITextEmbeddingGenerationService textEmbeddingGenerationService = new (
    modelId: "NAME_OF_MODEL",           // Name of the embedding model, e.g. "mistral-embed".
    apiKey: "API_KEY",
    endpoint: new Uri("YOUR_ENDPOINT"), // Optional uri endpoint including the port where MistralAI server is hosted. Default is https://api.mistral.ai.
    httpClient: new HttpClient()        // Optional; for customizing HTTP client
);

大事な

Google 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel.Connectors.Google;

#pragma warning disable SKEXP0070
GoogleAITextEmbeddingGenerationService textEmbeddingGenerationService = new (
    modelId: "NAME_OF_MODEL",       // Name of the embedding model, e.g. "models/text-embedding-004".
    apiKey: "API_KEY",
    apiVersion: GoogleAIVersion.V1, // Optional
    httpClient: new HttpClient()    // Optional; for customizing HTTP client
);

大事な

Hugging Face 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel.Connectors.HuggingFace;

#pragma warning disable SKEXP0070
HuggingFaceTextEmbeddingGenerationService textEmbeddingGenerationService = new (
    model: "NAME_OF_MODEL",             // Name of the embedding model.
    apiKey: "API_KEY",
    endpoint: new Uri("YOUR_ENDPOINT"), // Optional
    httpClient: new HttpClient()        // Optional; for customizing HTTP client
);

大事な

Ollama 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel.Embeddings;
using OllamaSharp;

#pragma warning disable SKEXP0070
using var ollamaClient = new OllamaApiClient(
    uriString: "YOUR_ENDPOINT"    // E.g. "http://localhost:11434" if Ollama has been started in docker as described above.
    defaultModel: "NAME_OF_MODEL" // E.g. "mxbai-embed-large" if mxbai-embed-large was downloaded as described above.
);

ITextEmbeddingGenerationService textEmbeddingGenerationService = ollamaClient.AsTextEmbeddingGenerationService();

大事な

ONNX 埋め込み生成コネクタは現在試験段階です。これを使用するには、#pragma warning disable SKEXP0070を追加する必要があります。

using Microsoft.SemanticKernel.Connectors.Onnx;

#pragma warning disable SKEXP0070
BertOnnxTextEmbeddingGenerationService textEmbeddingGenerationService = await BertOnnxTextEmbeddingGenerationService.CreateAsync(
    onnxModelPath: "PATH_ON_DISK",       // Path to the model on disk e.g. C:\Repos\huggingface\microsoft\TaylorAI\bge-micro-v2\onnx\model.onnx
    vocabPath: "VOCABULARY_PATH_ON_DISK" // Path to the vocabulary file on disk, e.g. C:\Repos\huggingface\TailorAI\bge-micro-v2\vocab.txt
);

テキスト埋め込み生成サービスの使用

すべてのテキスト埋め込み生成サービスは、指定された string 値から ReadOnlyMemory<float> ベクトルを生成できる 1 つのメソッド GenerateEmbeddingsAsync を持つ ITextEmbeddingGenerationService を実装します。 GenerateEmbeddingAsync 拡張メソッドは、同じアクションの単一値バージョンでも使用できます。

複数の値を使用してサービスを呼び出す方法の例を次に示します。

IList<ReadOnlyMemory<float>> embeddings =
    await textEmbeddingGenerationService.GenerateEmbeddingsAsync(
    [
        "sample text 1",
        "sample text 2"
    ]);

1 つの値でサービスを呼び出す方法の例を次に示します。

using Microsoft.SemanticKernel.Embeddings;

ReadOnlyMemory<float> embedding =
    await textEmbeddingGenerationService.GenerateEmbeddingAsync("sample text");

もうすぐです

詳細については、近日公開予定です。

もうすぐです

詳細については、近日公開予定です。

次の方法で共有

セマンティック カーネルでのテキスト埋め込みの生成

ローカル環境の設定

必要なパッケージのインストール

テキスト埋め込み生成サービスの作成

カーネルに直接追加する

依存性注入の使用

スタンドアロン インスタンスの作成

テキスト埋め込み生成サービスの使用

もうすぐです

もうすぐです

その他のリソース

セマンティックカーネルでのテキスト埋め込みの生成

スタンドアロンインスタンスの作成