RecognizeContentOptions クラス

  • java.lang.Object
    • com.azure.ai.formrecognizer.models.RecognizeContentOptions

public final class RecognizeContentOptions

クライアントで認識コンテンツ API を使用するときに渡される可能性があるオプションForm Recognizer。

コンストラクターの概要

コンストラクター 説明
RecognizeContentOptions()

RecognizeContentOptions オブジェクトを作成します。

メソッドの概要

修飾子と型 メソッドと説明
FormContentType getContentType()

フォームの型を取得します。

FormRecognizerLanguage getLanguage()

ドキュメント内のテキストの BCP-47 言語コードを取得します。

List<String> getPages()

複数ページのドキュメントのカスタム ページ番号を取得します (PDF/TIFF)。

Duration getPollInterval()

操作の状態の各ポーリング間の期間を取得します。

FormReadingOrder getReadingOrder()

認識されたテキスト行が返される順序を取得します。

RecognizeContentOptions setContentType(FormContentType contentType)

フォームの種類を設定します。

RecognizeContentOptions setLanguage(FormRecognizerLanguage language)

ドキュメント内のテキストの BCP-47 言語コードを設定します。

RecognizeContentOptions setPages(List<String> pages)

複数ページのドキュメントのカスタム ページ番号を設定します (PDF/TIFF)。

RecognizeContentOptions setPollInterval(Duration pollInterval)

操作の状態の各ポーリング間の期間を設定します。

RecognizeContentOptions setReadingOrder(FormReadingOrder readingOrder)

認識されたテキスト行が返される順序を指定します。

メソッドの継承元: java.lang.Object

コンストラクターの詳細

RecognizeContentOptions

public RecognizeContentOptions()

RecognizeContentOptions オブジェクトを作成します。

メソッドの詳細

getContentType

public FormContentType getContentType()

フォームの型を取得します。 .pdf、.jpg、.png、.tiff 型のファイル ストリームなど、サポートされているメディアの種類。

Returns:

値。contentType

getLanguage

public FormRecognizerLanguage getLanguage()

ドキュメント内のテキストの BCP-47 言語コードを取得します。 サポートされている言語コード については、こちらを参照してください

Returns:

ドキュメント内のテキストの言語コード。

getPages

public List getPages()

複数ページのドキュメントのカスタム ページ番号を取得します (PDF/TIFF)。 認識された結果を取得するページの数を入力します。

ページの範囲には、ハイフン (例: ["1-3"]) を使用します。 各ページまたはページ範囲をコンマ (例: ["1-3", 4] で区切ります。

Returns:

マルチページ ドキュメントのカスタム ページ番号の一覧。

getPollInterval

public Duration getPollInterval()

操作の状態の各ポーリング間の期間を取得します。 何も指定しない場合は、既定値の 5 秒が使用されます。

Returns:

値。pollInterval

getReadingOrder

public FormReadingOrder getReadingOrder()

認識されたテキスト行が返される順序を取得します。

Returns:

認識された行が返される順序。

setContentType

public RecognizeContentOptions setContentType(FormContentType contentType)

フォームの種類を設定します。 .pdf、.jpg、.png、.tiff 型のファイル ストリームなど、サポートされているメディアの種類。

Parameters:

contentType - 指定されたフォーム コンテンツ タイプ。

Returns:

更新 RecognizeContentOptions された値。

setLanguage

public RecognizeContentOptions setLanguage(FormRecognizerLanguage language)

ドキュメント内のテキストの BCP-47 言語コードを設定します。 サポートされている言語コード については、こちらを参照してください

Parameters:

language - 設定する言語コード値。

Returns:

更新 RecognizeContentOptions された値。

setPages

public RecognizeContentOptions setPages(List pages)

複数ページのドキュメントのカスタム ページ番号を設定します (PDF/TIFF)。 認識された結果を取得するページの数を入力します。

ページの範囲には、ハイフン (例: ["1-3"]) を使用します。 各ページまたはページ範囲をコンマ (例: ["1-3", 4] で区切ります。

Parameters:

pages - 設定するカスタム ページ番号の値。

Returns:

更新 RecognizeContentOptions された値。

setPollInterval

public RecognizeContentOptions setPollInterval(Duration pollInterval)

操作の状態の各ポーリング間の期間を設定します。 何も指定しない場合は、既定値の 5 秒が使用されます。

Parameters:

pollInterval - 操作の状態の各ポーリング間で指定する期間。

Returns:

更新 RecognizeContentOptions された値。

setReadingOrder

public RecognizeContentOptions setReadingOrder(FormReadingOrder readingOrder)

認識されたテキスト行が返される順序を指定します。 並べ替え順序は、検出されたテキストによって異なるため、イメージ間で変更され、OCR バージョンが更新される可能性があります。 したがって、ビジネス ロジックは、順序ではなく実際の行の場所に基づいて構築する必要があります。

Parameters:

readingOrder - 順序は、テキスト行が返される順序を指定します

Returns:

更新 RecognizeContentOptions された値。

適用対象