キーワード クラウドを解釈する

Viva Glintの自然言語処理 (NLP) テクノロジは、関連する、一般的に発生する、フィルター処理された母集団に固有のキーワードとフレーズを抽出します。 キーワード (keyword) クラウドは、コメント レポートで使用できるセクションです。

  • 関連性は、組織のアンケートで自然に予想される出現回数よりも、キーワード (keyword)が表示される頻度によって定義されます。
  • キーワード (keyword) クラウド内の単語のサイズは、用語の関連性に基づいています。
  • はセンチメント (正、負、またはニュートラル) を表します。

キーワード (keyword) クラウドの生成

キーワード (keyword) クラウドをレポートによって生成するには、最小限のコメント数が必要です。 また、キーワード (keyword)を表示するには最小限の出現回数が必要であり、単語はGlint独自の辞書に含まれている必要があります。 キーワード (keyword) クラウドは常に英語ですが、NLP は他の言語からのコメントを翻訳します。

キーワード (keyword) クラウド手法を理解する

Glintのキーワード (keyword)手法では、キーワードは次のものが必要です。

  • 従業員エンゲージメントのコンテキスト内で本質的に意味がある
  • アンケートの結果のコンテキスト内で関連する
  • 他社調査に比べてユニーク

次の手順では、キーワードがキーワード (keyword) クラウドに含まれると見なされる方法と理由について説明します。

キーワードの分離

キーワード (keyword) クラウドを構築するための最初の手順は、単語が実際にキーワード (keyword)として適格かどうかを特定することですそのためには、Viva Glintの自然言語処理 (NLP) テクノロジによってキーワードが定義され、ストップ ワードが除外され、ワード シーケンスが分析されます。

キーワードの定義

Glintには、16,000 を超えるキーワードを持つ独自の辞書があり、一般的に従業員のエンゲージメントに関連付けられています。 エンゲージメントに関連付けられていない場合、アンケートで最もよく使用される単語の一部がキーワード (keyword) クラウドに含まれていない可能性があります。
Glintの辞書は、機械学習と人間のタッチの組み合わせによって継続的に更新されます。 アンケートのコメントは辞書と照合され、クラウドの包含について考慮する必要があるキーワードキーワード (keyword)分離されます。

ストップ ワードの除外

定義上、キーワード (keyword)は重要である必要があります。 たとえば、"the" や "to" のような単語は意味がほとんどなく、"ストップ ワード" と見なされます。 これらの単語は、Glintの辞書から除外されます。 さらに、コメント分析では、"満足" や "リーダーシップ" などの意味のある単語のみが考慮されます。

Wordシーケンスの分析

技術的には、キーワード (keyword)は 1 つの単語 ("優先順位" など) または "キャリア開発" などの単語文字列です。 1 つまたは複数の単語のキーワード (keyword)を分離するために、各アンケート コメントはさまざまなシーケンスに分割されます。 例として、「私は幸せで、仕事の生活のバランスを取っています」というコメントを見てみましょう。

  • 1 つの単語シーケンス: I、am、happy、have、work、life、Balance、...
  • 2 つの単語シーケンス: 私は幸せで、幸せで、持っています。..
  • 3 つの単語シーケンス: ...仕事を持ち、仕事の生活、仕事の生活のバランスを取る。 その後、各シーケンスがGlintのキーワード (keyword)ディクショナリと照合されます。 この例では、"happy" と "仕事の生活のバランス" というキーワードをキーワードとして定義します

スコアリング キーワード

キーワード (keyword)が分離されると、Glintは関連性と顕著性 (つまり有用性) に基づいてスコアを割り当てます。

  • 関連性を計算するために、スコアリング アルゴリズムはスライス内のキーワード (keyword)の頻度を決定します。 スライスとは、会社全体のアンケートの結果や、アンケート内のフィルター処理されたグループの結果など、データのカットです。 スライス内のキーワード (keyword)の頻度が高いほど、関連性が高くなり、スコアが向上します。
  • 顕著さを識別するために、キーワード (keyword)は、他のスライスやアンケートと比較して一意の場合にのみ機能します。 スコアリング アルゴリズムは、Glintに関するすべてのコメント内のキーワード (keyword)の頻度を、すべての企業で決定します。 ここで、キーワード (keyword)の頻度が高いほど顕著性が低いことを示し、スコアが低下する。 スコアが最も高いキーワードは、最終的な並べ替えプロセスを経て、最終的にキーワード (keyword) クラウドで取り上げられるかを決定します。

キーワードの並べ替え

アンケートの結果を適切に表すために、キーワード (keyword) クラウドは、できるだけ多くのアンケートのコメントを表す必要があります。 また、すべてのコメントのキーワードと、最も意味のあるキーワードを表すバランスも必要です。

たとえば、特定のキーワード (管理、コミュニケーション、フィードバックなど) は、通常、すべてのスライス内のコメント全体とすべての企業にわたって高い頻度を持ちます。 キーワード クラウドは、ほぼすべてのシナリオで簡単に同じように見える可能性がありますが、これは役に立ちません。

キーワードを効果的に並べ替えるには、Glintは、キーワード (keyword) クラウドに含めるために、スライスのコメントにキーワード (keyword)が表される最適な時間範囲を使用します。 この範囲は スライス カバレッジと呼ばれます。 最適なスライス カバレッジ範囲には、最も頻度の高いキーワードは含まれません。 目的は、一般的に発生する高スコアのキーワードを含め、一意の値を失うほど頻繁ではないキーワードを含めないようにすることです。

Glintは、最終的な並べ替えプロセスを通じてスライスのキーワードを配置します。

  1. 最もスコアの高いキーワード (keyword)は、考慮のために前方にプルされます。 最適なスライス カバレッジ範囲に収まる場合は、キーワード (keyword) クラウドに追加されます。
  2. 次に最もスコアが高いキーワード (keyword)を持つコメントは、最適なスライス カバレッジ範囲と比較されます。 などなど。。。
  3. すべてのキーワードが最初の最適なスライス カバレッジ範囲と一致するわけではないため、Glintは残りのコメントのキーワードを次に最適なスライス カバレッジ範囲と照合します。

この並べ替えプロセスは、対象となるキーワードの数に達するまで繰り返されます。 分離、スコア付け、並べ替えのこのプロセスを通じて、Glintのキーワード (keyword) クラウドには、意味のある、一般的に発生する、一意のキーワードが含まれています。