トレーニング
認定資格
Microsoft Certified: Azure AI Fundamentals - Certifications
AI ソリューションを作成するための Microsoft Azure のソフトウェアとサービスの開発に関連する基本的な AI の概念を示します。
このブラウザーはサポートされなくなりました。
Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。
重要
Windows App SDK の最新の 試験的チャネル リリースで使用できます。
Windows App SDK の実験用チャネルには、開発の初期段階の API と機能が含まれています。 実験用チャネル内のすべての API は、広範な変更と破壊的変更の対象となり、今後のリリースからいつでも削除される可能性があります。 試験段階の機能は運用環境での使用はサポートされておらず、使用するアプリは Microsoft Store に公開できません。
画像内のテキスト (文字、単語、線、多角形のテキスト境界、各一致の信頼度) を検出して抽出し、コンピューターで読み取り可能な文字ストリームに変換できる、人工知能 (AI) によってサポートされるWindows アプリ SDK API について説明します。
詳細については、Windows アプリ SDKの「Get Started with Text Recognition (OCR)」を参照してください。
ヒント
これらの API とその機能に関するフィードバックを提供するには、Windows App SDK GitHub リポジトリに 新しいIssue を作成してください (タイトルに OCR を含む) または既存のIssueに応答してください。
画像のテキスト コンテンツを分析する機械学習モデルの API を提供します。
public enum DetectedLineStyle
認識できる行のスタイルを指定します。
テキスト行は手書きです。
テキスト行は手書きではありません。
public enum OrientationDetectionOptions
認識できるテキストの向きを指定します。
向きが認識されません。
向きが認識されます。
public sealed class RecognizedLine
認識されたテキストの 一行を表します。
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
認識された行のスタイルを取得します。
認識された行のスタイル。
テキスト行が手書きであったかどうか、および認識の信頼度が含まれます。
public string Text { get; }
認識された行のテキストを取得します。
認識された行のテキスト。
すべての単語がスペースで連結されています。
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
認識された行の単語。
認識された行の単語。
public struct RecognizedLineStyle
認識された行のスタイルを表します。
行スタイル認識の信頼度レベル。
行のスタイル名。
public sealed class RecognizedText
画像からテキストへの認識操作の結果を表します。
public float ImageAngle { get; }
認識されたテキストの時計回りの回転角度を度単位で取得します。
認識されたテキストの時計回りの回転角度 (度単位)。
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
認識された行のコレクションを取得します。
認識された行のコレクション。
public sealed class RecognizedWord
認識された ひとつの単語を表します。
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
認識された単語の四角形境界を取得します。
認識された単語の四角形境界。 TopLeft は、単語の回転を基準にしています。
public float Confidence { get; }
この単語が正しく認識された可能性を取得します。
この単語が正しく認識された可能性。 値の範囲は 0.0 から 1.0 (両端の値を含む) です。
public string Text { get; }
認識された単語のテキストを取得します。
認識された単語のテキスト。
public struct BoundingBox
認識された単語とテキスト行の境界に使用される 4 つのポイントを持つ多角形。
境界ボックスの左下隅。
境界ボックスの右下隅。
境界ボックスの左上のポイント。
境界ボックスの右上のポイント。
単語または行の境界として返された場合、TopLeft、TopRight、BottomRight、および BottomLeft ポイントは、画像内で認識されたテキストの回転と傾斜を基準とします。 次の図は、0 が TopLeft、1 が TopRight、2 が BottomRight、3 が BottomLeft (すべてテキストを基準とする) であるさまざまなテキスト回転のポイント レイアウトを示しています。
public sealed class TextRecognizer : System.IDisposable
ソース画像内の単語と行、およびその四角形の境界を認識します。
オブジェクトと関連付けられているリソースを破棄します。
C# では実装されていません。
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
TextRecognizer クラスの新しいインスタンスを非同期的に作成します。
TextRecognizer クラスの新しいインスタンス。
GetModelReadyStatus が Ready でない場合、エラーが返されます。
public static bool IsAvailable ();
基になる言語モデルがインストールされているかどうかを取得します。
基になる言語モデルがインストールされている場合は True。 それ以外の場合は、 falseです。
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
基になる言語モデルがインストールされ、使用できることを確認します。
完了時に PackageDeploymentResult を返す進行状況を含む非同期アクション。
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
指定された画像内のテキストを認識します。
圧縮されていないビットマップ。
TextRecognizer のテキスト認識モデルを構成するためのオプション。
認識されたテキスト。
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
指定された画像内のテキストを非同期的に認識します。
圧縮されていないビットマップ。
TextRecognizer のテキスト認識モデルを構成するためのオプション。
認識されたテキスト。
public sealed class TextRecognizerOptions
TextRecognizer のテキスト認識モデルを構成するためのオプションを提供します。
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
最大画像サイズを取得または設定します。
最大画像サイズ。 既定値は、幅 1152、高さ 768 です。
このサイズは提案であり、常に優先されるとは限りません。
ソース画像が最大サイズより大きい場合は、自動的にサイズの上限に縮小されます。
public uint MaxLineCount { get; set; }
認識操作から返される行の最大数を取得または設定します。
認識操作から返される行の最大数。
既定値は MaxLineCountSupported です。 指定した場合、返される最大行数は、この値と MaxLineCountSupported の小さい方になります。
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
テキストの向きを検出するかどうかを取得または設定します。
テキストの向きを検出するかどうか。 既定値は None です。
public TextRecognizerOptions ();
TextRecognizerOptions クラスの新しいインスタンスを初期化します。
トレーニング
認定資格
Microsoft Certified: Azure AI Fundamentals - Certifications
AI ソリューションを作成するための Microsoft Azure のソフトウェアとサービスの開発に関連する基本的な AI の概念を示します。