インデックス作成時にテキストとイメージを処理するための組み込みスキル (Azure Cognitive Search)
この記事では、Azure Cognitive Search で提供され、生の非構造化テキストやイメージ ファイルからコンテンツと構造を抽出するためにスキルセットに含めることのできるスキルについて説明します。 スキルとは、コンテンツを何らかの方法で変換するアトミック操作のことです。 スキルは、多くの場合はテキストを認識または抽出する操作ですが、既に作成されているエンリッチメントを再形成するユーティリティ スキルの場合もあります。 通常、出力はテキストベースで、フル テキスト クエリで使用できます。
組み込みのスキル
組み込みのスキルは、Microsoft によって事前にトレーニングされたモデルに基づいています。そのモデルをユーザーが独自のトレーニング データを使用してトレーニングすることはできません。 Cognitive Resources API を呼び出すスキルは、それらのサービスに対して依存関係があり、リソースをアタッチするときに Cognitive Services の従量課金制の料金が請求されます。 その他のスキルは、Azure Cognitive Search によって課金されるか、無料で提供されるユーティリティ スキルです。
次の表で、組み込みのスキルを一覧で表示して説明します。
OData 型 | 説明 | 課金元 |
---|---|---|
Microsoft.Skills.Text.CustomEntityLookupSkill | ユーザーが定義したカスタムの単語と語句のリストからテキストを検索します。 | Azure Cognitive Search (価格) |
Microsoft.Skills.Text.KeyPhraseExtractionSkill | このスキルでは、トレーニング済みモデルを使用し、語句の配置、言語規則、他の語句との近さ、ソース データ内での語句の不自然さの程度に基づいて、重要な語句を検出します。 | Cognitive Services (価格) |
Microsoft.Skills.Text.LanguageDetectionSkill | このスキルでは、トレーニング済みモデルを使用し、使用されている言語を検出します (ドキュメントごとに 1 つの言語 ID)。 同じテキスト セグメント内で複数の言語が使用されている場合、出力は、主に使用されている言語の LCID になります。 | Cognitive Services (価格) |
Microsoft.Skills.Text.MergeSkill | フィールドのコレクションからのテキストを 1 つのフィールドに統合します。 | 該当なし |
Microsoft.Skills.Text.V3.EntityLinkingSkill | このスキルでは、事前トレーニング済みのモデルを使用し、認識されたエンティティに対して Wikipedia の記事へのリンクを生成します。 | Cognitive Services (価格) |
Microsoft.Skills.Text.V3.EntityRecognitionSkill | このスキルでは、トレーニング済みモデルを使用し、"Person" 、"Location" 、"Organization" 、"Quantity" 、"DateTime" 、"URL" 、"Email" 、"PersonType" 、"Event" 、"Product" 、"Skill" 、"Address" 、"Phone Number" および "IP Address" の各フィールドのカテゴリの固定したセットに対してエンティティを確立します。 |
Cognitive Services (価格) |
Microsoft.Skills.Text.PIIDetectionSkill | このスキルは、事前トレーニングされたモデルを使用して、特定のテキストから個人情報を抽出します。 また、このスキルには、テキスト内で検出された個人情報エンティティをマスクするためのさまざまなオプションも用意されています。 | Cognitive Services (価格) |
Microsoft.Skills.Text.V3.SentimentSkill | このスキルでは、トレーニング済みのモデルを使用し、レコードごとに文章とドキュメントレベルでサービスによって検出された最も高い信頼度スコアに基づいて、センチメント ラベル ("ネガティブ"、"中立"、"ポジティブ" など) を割り当てます。 | Cognitive Services (価格) |
Microsoft.Skills.Text.SplitSkill | コンテンツを徐々に強化または拡張できるように、テキストをページに分割します。 | 該当なし |
Microsoft.Skills.Text.TranslationSkill | このスキルは、正規化やローカライズのユース ケース向けに、トレーニング済みモデルを使用して入力テキストをさまざまな言語に翻訳します。 | Cognitive Services (価格) |
Microsoft.Skills.Vision.ImageAnalysisSkill | このスキルでは、画像検出アルゴリズムを使用して画像の内容を識別し、テキストの説明を生成します。 | Cognitive Services (価格) |
Microsoft.Skills.Vision.OcrSkill | 光学式文字認識。 | Cognitive Services (価格) |
Microsoft.Skills.Util.ConditionalSkill | 条件に基づくフィルター処理、既定値の割り当て、データのマージを行うことができます。 | 該当なし |
Microsoft.Skills.Util.DocumentExtractionSkill | エンリッチメント パイプライン内のファイルからコンテンツを抽出します。 | Azure Cognitive Search (価格) |
Microsoft.Skills.Util.ShaperSkill | 出力を複合型 (フル ネーム、複数行の住所、または姓と個人識別子の組み合わせに使用される可能性があるマルチパート データ型) にマップします。 | 該当なし |
カスタム スキル
カスタム スキルは、設計、開発、および Web へのデプロイを行うモジュールです。 その後、スキルセット内からカスタム スキルとしてモジュールを呼び出すことができます。
型 | 説明 | 課金元 |
---|---|---|
Microsoft.Skills.Custom.WebApiSkill | カスタム Web API に対して HTTP 呼び出しを行うことで、AI エンリッチメント パイプラインを拡張することができます | ソリューションで従量制課金の Azure サービスを使用していない場合は、なし |
Microsoft.Skills.Custom.AmlSkill | Azure Machine Learning モデルで AI エンリッチメント パイプラインを拡張できるようにします | ソリューションで従量制課金の Azure サービスを使用していない場合は、なし |
カスタム スキルの作成ガイダンスについては、カスタム インターフェイスの定義と AI エンリッチメント用のカスタム スキルを作成する方法に関する記事を参照してください。