Azure OpenAI Whisperモデルの出力形式の指定について

乙幡 和寛 0 評価のポイント
2024-09-12T02:36:30.9366667+00:00

Azure OpenAIのWhisperを使って文字起こしを行っているのですが、

同音異義語などがある場合に毎回結果がまちまちになってしまいます。

(例:「化学」と「科学」、「機会」と「機械」、「清算」と「精算」など)

結果のブレを軽減するために、「Kagaku」を読み上げたら「かがく」のように、

結果をすべてひらがなで出力してほしいのですが、APIのリクエスト時に

何らかのパラメータを渡すことによって、結果をすべてひらがなで

出力するような動作を実現可能でしょうか。

Azure
Azure
Microsoft が管理する世界のデータ センター ネットワークを介してアプリケーションとサービスを構築、配置、および管理するインフラストラクチャおよびクラウド コンピューティング プラットフォーム。
0 件のコメント コメントはありません
{count} 件の投票

お客様の回答

質問作成者は回答に "承認済み"、モデレーターは "おすすめ" とマークできます。これにより、ユーザーは作成者の問題が回答によって解決したことを把握できます。