既知の問題 - Microsoft Foundry

この記事では、Foundry の既知の問題と回避策を示します。 サポート リクエストを送信する前に、これらの問題を確認してください。

エージェント サービス

現在アクティブな既知の問題はありません。

鋳造ツール

Foundry Tools の Azure Speech

次の表では、Speech to Text (STT)、テキスト読み上げ (TTS)、Speech SDK/Runtime など、音声に関する現在の既知の問題について説明します。

音声テキスト変換 (STT) のアクティブな既知の問題

次の表に、音声テキスト変換の現在の既知の問題を示します。

問題ID カテゴリ タイトル 説明 回避策 発行日
1001 コンテンツ ポンド単位での STT 文字起こし リアルタイムの文字起こしでは、言語設定に関係なく、英国の方言で語句が読み上げられたときに、"ポンド" が誤って "lbs" に変換されることがよくあります。 Custom Display Post Processing (DPP) を使用して、既定の DPP 結果を修正するカスタム音声モデルをトレーニングします (たとえば、ポンド {tab} ポンド)。 詳細については、「 カスタム音声の表示テキスト形式トレーニング データを準備する方法」を参照してください。 2025 年 6 月 9 日
1002 コンテンツ 基本方向がある STT 文字起こし 音声認識モデル20241218では、カーディナル方向を含むオーディオ入力が不正確に解釈される可能性があります。 たとえば、"SW123456" は "南西123456" として文字起こしされる場合があります。他のカーディナル方向でも同様のエラーが発生する可能性があります。 書き換えルールの "サウスウエスト" を "SW" にマップするには、カスタム表示の書式設定を使用します。 詳細については、「 カスタム音声の表示テキスト形式トレーニング データを準備する方法」を参照してください。 2025 年 6 月 9 日
1003 モデル STT 文字起こしには、予期しない内部システム タグが含まれている可能性があります "nsnoise" のような予期しないタグが文字起こしの結果に表示されます。 この問題は、最初にアラビア語モデル (ar-SA) について報告されましたが、英語モデル (en-US および en-GB) でも発生します。 今後のモデル更新では、トレーニング データから "nsnoise" を削除するフィルターが追加されます。 回避策はありません。 修正プログラムは、将来のモデルの更新で計画されています。 2025 年 6 月 9 日
1004 モデル 言語固有の名前と単語のスペルが不正確な STT 文字起こし 階層 2 ロケールの基本モデルにエンティティ カバレッジがないため、言語固有の名前の文字起こしが不正確です。 この問題は、ベース モデルが以前に特定の単語を検出したことがない場合に発生します。 カスタム音声モデルをトレーニングして、不明な名前と単語をトレーニング データとして含めます。 認識精度を向上させるために、実行時に不明な単語を フレーズ リスト として追加することもできます。 2025 年 6 月 9 日
1005 ファイルの種類 STT リアルタイム出力で追加されるコンテキスト外の単語 バックグラウンド ノイズのみで構成されるオーディオ ファイルでは、文字起こしが不正確になることがあります。 理想的には、読み上げられた文のみを文字起こしする必要がありますが、これは nl-NL モデルでは発生しません。 ノイズ抑制とエコー キャンセルには、Speech SDK に組み込まれている Microsoft Audio Stack (MAS) を使用します。 この最適化は、STT サービスに到達する前のオーディオ品質の向上に役立ちます。 2025 年 6 月 9 日
1006 ファイルの種類 "moov atom" 位置による MP4 デコードエラー "moov atom" が先頭ではなくファイルの末尾に配置されているため、MP4 コンテナー ファイルのデコードが失敗する可能性があります。 この構造により、現在のサービス (特に 10 MB を超えるファイルの場合) に対してファイルをストリーミングできなくなります。 オーディオ コーデック ユーティリティを使用してファイルを前処理し、"moov atom" を先頭に移動するか、ファイルを MP3 に変換します。 2025 年 8 月 8 日

テキスト読み上げ (TTS) のアクティブな既知の問題

次の表に、テキスト読み上げに関する現在の既知の問題を示します。

問題ID カテゴリ タイトル 説明 回避策 発行日
2001 サービス REST API を使用したモデルのコピー TTS サービスでは、ディザスター リカバリーのために REST API 経由でモデルをコピーすることはできません。 回避策はありません。 これは現在の制限事項です。 2025 年 6 月 9 日
2002 TTS アバター パラメーターがありません TTS アバター パラメーターの avatarPositionavatarSize は、バッチ合成ではサポートされていません。 回避策はありません。 これは現在の制限事項です。 2025 年 6 月 9 日
2003 TTS アバター BLOB のファイル名が見つかりません Batch アバター合成ジョブの outputs: result URL には、BLOB ファイル名は含まれません。 一時的な回避策として subtitleType = soft_embedded を使用します。 2025 年 6 月 9 日
2004 TTS アバター TTS アバターでサポートされていないバッチ合成 アバターのバッチ合成では、Bring Your Own-Storage (BYOS) はサポートされていないため、ストレージ アカウントで外部トラフィックを許可する必要があります。 回避策はありません。 これは現在の制限事項です。 2025 年 6 月 9 日
2005 サービス 2025 年 7 月の移行後の DNS キャッシュの更新 コンプライアンス上の理由から、2025 年 7 月 31 日にアジアのレガシ Speech TTS クラスターが削除されました。 新しい IP に移行されたすべてのトラフィック。 一部のお客様は、更新されていない永続的なローカルまたはセカンダリ DNS キャッシュが原因で引き続き問題が発生する可能性があります。 ローカルとセカンダリの DNS キャッシュをクリアして、新しい TTS クラスター IP の接続の問題を解決します。 2025 年 7 月 24 日
2006 TTS 出力でのワード境界の重複 Azure TTS では、特に特定の SSML 構成を使用する場合に、合成出力で重複した単語境界エントリが返されることがあります。 この重複により、ダウンストリーム アプリケーションのタイミング データが不正確になり、ずれが発生する可能性があります。 出力を後処理して、タイムスタンプと単語の内容に基づいて重複する単語の境界を除外します。 2025 年 8 月 8 日
2007 TTS アラビア語の音声で部分的に生成された単語 アラビア語の音声出力には、特に ة または ت で終わる単語の発音が不明確または不完全な場合に部分的に生成された単語が含まれます。 この問題は、複数の音声で再現できます。 この問題を軽減するには、音声出力テキストの言い換えをご検討ください。 2025 年 9 月 16 日

Speech SDK/Runtime のアクティブな既知の問題

次の表に、Speech SDK/Runtime の現在の既知の問題を示します。

問題ID カテゴリ タイトル 説明 回避策 発行日
3001 SDK/ランタイム InitialSilenceTimeout パラメーターが原因で 400 エラーが発生する InitialSilenceTimeoutを 0 に設定すると、400 エラーが発生します。 endSilenceTimeoutパラメーターは、文字起こしが正しくない可能性もあります。0 以外の値に設定すると、指定した期間が経過すると、システムはユーザー入力を無視します。 InitialSilenceTimeoutMsを使用して、初期無音によるタイムアウトを無効にして、SpeechConfig.fromSubscription(subscriptionKey, region)を 0 に設定します。 シングルショット認識の場合、セッションは最初の無音状態から 30 秒後に終了します。 継続的な認識のために、サービスは 30 秒後に空のフレーズを報告し、続行します。 Speech_SegmentationMaximumTimeMs パラメーターは、フレーズの最大長 (既定値: 30,000 ミリ秒) を決定します。 2025 年 6 月 9 日
3002 SDK/ランタイム SegmentationTimeout パラメーターによって誤った単語が発生する SegmentationSilenceTimeoutが 1,000 ミリ秒を超えると、音声認識の結果にランダムな単語が表示されます。 既定の SegmentationTimeout 値である 650 ミリ秒を維持します。 2025 年 6 月 9 日
3003 SDK/ランタイム STT でのリアルタイムのダイアライゼーション中に話者の発言時間が欠けている STT でリアルタイムのダイアライズを使用する場合、Python SDK では話者の継続時間は表示されません。 Conversation 文字起こしの結果クラスのドキュメントに従って、結果のオフセットと期間を確認します。 2025 年 6 月 9 日
3004 SDK/TTS アバター JavaScript SDK 使用時に頻繁に接続が切断される TTS アバターは、JavaScript SDK でカスタム アバターを使用するときに、読み込んだり、頻繁に切断したり、再接続したりしません。 UDP ポート 3478 を開きます。 2025 年 6 月 9 日

Foundry Tools の Azure Translator

次の表では、Translator の現在の既知の問題について説明します。

テキスト翻訳のアクティブな既知の問題

問題ID カテゴリ タイトル 説明 回避策 発行日
4001 モデル コンテキストと代名詞の保持 一部の翻訳モデルでは代名詞 (特に第三者代名詞) が適切に処理されません。 この問題は、文レベルのトレーニングと推論でコンテキストが保持されないために発生します。 製品チームは、すべてのモデルをドキュメント レベルのトレーニングと推論に移行するために積極的に取り組んでいます。 直接の回避策はありません。 必要に応じて、代名詞の使用状況を手動で確認して調整します。 2025 年 2 月 5 日
4002 コンテンツ 言語が混在するテキストを使用して文を翻訳する テキスト翻訳 API では、言語が混在する入力を含む文の翻訳はサポートされていません。 1 つの文に複数の言語が含まれている場合、翻訳が正しくないか不完全になる可能性があります。 目的のソース言語を指定するか、混合言語の文を削除するか、テキストを単一言語セグメントに分割します。 2025 年 2 月 5 日

ドキュメント翻訳のアクティブな既知の問題

問題ID カテゴリ タイトル 説明 回避策 発行日
5001 書式設定 数式の書式設定 翻訳されたドキュメントでは、数式の書式が完全に保持されない場合があります。 上付き文字と下付き文字の番号は、誤って再フォーマットされる可能性があります。 直接の回避策はありません。 必要に応じて、数式の書式を手動で調整します。 2025 年 2 月 5 日
5002 コンテンツ ソース言語が混在するドキュメントの翻訳 ドキュメント翻訳では、複数の言語のソース ドキュメントが翻訳されず、結果が正しくないか不完全になる可能性があります。 目的のソース言語を指定します。 または、言語が混在する文を削除するか、テキストを 1 つの言語のみを含むセグメントに分割します。 2025 年 2 月 5 日
5003 ファイルの種類 複雑なドキュメントの翻訳 何千もの複雑なページを含むドキュメントでは、抽出、翻訳、再アセンブルのプロセス中にエラーが発生する可能性があります。 多くの場合、これらのドキュメントには、画像、画像内の埋め込みテキスト、手動で入力されたテキストが含まれます。 大きなドキュメントをより小さなセクションに分割し (たとえば、1,000 ページのファイルを 100 ページの約 10 個のファイルに分割するなど)、個別に送信します。 2025 年 2 月 5 日
5004 書式設定 罫線のないグラフとテーブルを含むドキュメントの翻訳 水平方向と垂直方向のテキスト、さまざまなセル サイズ、または罫線のないグリッド構造が混在するグラフやテーブルは、翻訳中に正確に書式設定するのが困難です。 罫線のないテーブルやグラフではなく、罫線付きテーブルとグラフを使用してドキュメントを再作成し、翻訳の出力品質を向上させます。 2025 年 4 月 1 日
5005 コンテンツ 目に見える透かしやシールを含むドキュメントの翻訳 目に見える透かしやシールがテキストと重なる可能性があるため、モデルがコンテンツを正確に認識して処理することが困難になります。 ドキュメントは翻訳されていないか、部分的にしか翻訳されない場合があります。 最適な翻訳結果を得るには、透かしのないクリーンなドキュメントを使用します。 2025 年 5 月 21 日

Azure Machine Learning

Azure Machine Learning に関連する既知の問題については、 Azure Machine Learning の既知の問題に関するページを参照してください。