キーワード認識に関する推奨事項とガイドライン

この記事では、キーワードを選択してその正確性特性を最適化する方法と、キーワード確認を使用してユーザー エクスペリエンスを設計する方法について説明します。

有効なキーワードの選択

有効なキーワードを作成することは、製品による正確で一貫した応答を保証するうえで不可欠です。 キーワードを選択するときには、以下のガイドラインを考慮に入れます。

Note

このセクションの例は英語ですが、カスタム キーワードでサポートされているすべての言語にこのガイドラインが適用されます。 サポートされているすべての言語の一覧については、言語のサポートに関するページを参照してください。

  • 2 秒以内に読み上げることができる必要があります。
  • 4 音節から 7 音節の単語が最適です。 たとえば、"Hey, Computer" は適切なキーワードです。 "Hey" だけではよくありません。
  • キーワードは、エンドユーザーのネイティブ言語に固有の一般的な発音規則に従う必要があります。
  • 一般的な発音規則に従った一意の単語や造語にすると、擬陽性が減る可能性があります。 たとえば "computerama" が適切なキーワードになる可能性があります。
  • 一般的な単語は選択しないでください。 たとえば、"eat" や "go" は、普通の会話の中で頻繁に出てくる単語です。 これらの単語に関する他人受入率は、製品に対して求める割合よりも高くなる可能性があります。
  • 別の発音をする可能性があるキーワードは使用しないようにします。 ユーザーは、音声で製品を有効にするための "正しい" 発音を知っている必要があります。 たとえば "509" は "ファイブ ゼロ ナイン"、"ファイブ オー ナイン"、あるいは "ファイブ ハンドレッド アンド ナイン" と発音されます。"R.E.I."は "アール-イー-アイ" や "レイ" と発音されます。"Live" は "/līv/" や "/liv/" と発音されます。
  • 特殊文字、記号、または数字は使用しないでください。 たとえば、"Go#" や "20 + cats" は、問題を引き起こすキーワードになる可能性があります。 ただし、"go sharp" や "twenty plus cats" は機能するでしょう。 それでもブランディングにおいて記号を使用して、正しい発音が一般に認知されるように、マーケティングやドキュメントを利用することができます。

キーワード検証に関するユーザー エクスペリエンスの推奨事項

キーワード検証が使用されるマルチステージのキーワード認識シナリオでは、アプリケーションでエンドユーザーにキーワード検出を通知させるタイミングを選択できます。 視覚または可聴インジケーターをレンダリングする際には、キーワード検証サービスからの応答を頼りにすることをお勧めします。

User experience guideline when optimizing for accuracy.

これで、誤って受け入れてしまうユーザー認識の影響を最小限に抑えるという正確性の観点からは最適なエクスペリエンスを確保できますが、余分の待機時間が発生することになります。

待機時間を最適化する必要のあるアプリケーションでは、デバイス上のキーワード認識に基づいて、エンドユーザーに対して軽い控えめなインジケーターを提供できます。 たとえば、LED パターンを点灯させたり、アイコンを点滅させたりします。 キーワード検証でキーワードが受け入れられた場合は、インジケーターを存続させ、キーワードが拒否された場合は無視することができます。

User experience guideline when optimizing for latency.

次のステップ