Поделиться через


Интерпретация облака ключевых слов

Технология обработки естественного языка (NLP) Viva Glint извлекает ключевые слова и фразы, которые являются релевантными, часто встречающимися и уникальными для отфильтрованной совокупности. Ключевое слово облако — это раздел, доступный в отчете Примечания.

  • Релевантность определяется тем, насколько чаще появляется ключевое слово, чем ожидалось в ходе организационных обследований.
  • Размер слова в ключевое слово облаке зависит от релевантности термина.
  • Цвет представляет тональность (положительную, отрицательную или нейтральную).

Создание облака ключевое слово

Для создания отчета ключевое слово облака требуется минимальное количество комментариев. Кроме того, должно быть минимальное количество вхождений для ключевое слово, а слово должно находиться в собственном словаре Glint. Облако ключевое слово всегда на английском языке, но NLP переводит комментарии с других языков.

Общие сведения о методологии ключевое слово облака

Методология ключевое слово Glint требует, чтобы ключевые слова были следующими:

  • По своей сути значимые в контексте вовлеченности сотрудников
  • Релевантный в контексте результатов опроса
  • Уникальный по сравнению с опросом других компаний

Ниже описано, как и почему ключевые слова рассматриваются для включения в ключевое слово облаке.

Изоляция ключевых слов

Первым шагом к созданию ключевое слово облака является определение того, действительно ли слово квалифифисируется как ключевое слово. Для этого технология обработки естественного языка (NLP) Viva Glint определяет ключевые слова, исключает стоп-слова и анализирует последовательность слов.

Определение ключевых слов

Glint имеет собственный словарь с более чем 16 000 ключевых слов, которые обычно связаны с вовлеченности сотрудников. Если это не связано с взаимодействием, некоторые из наиболее часто используемых слов опроса могут не быть включены в ключевое слово облаке.
Словарь Glint постоянно обновляется благодаря сочетанию машинного обучения и человеческого прикосновения. Комментарии к опросу сопоставляются со словарем, чтобы изолировать ключевые слова, которые следует учитывать для ключевое слово включения в облако.

Исключение стоп-слов

По самому определению ключевое слово должна быть значительной. Например, такие слова, как "the" или "to", имеют мало смысла и считаются "стоп-словами". Эти слова исключаются из словаря Glint. В свою очередь, анализ комментариев учитывает только значимые слова, такие как "удовлетворен" или "руководство".

Анализ последовательности Word

Технически ключевое слово может быть одним словом (например, "приоритеты") или строкой слова, например "развитие карьеры". Чтобы изолировать один или многословный ключевое слово, каждый комментарий к опросу разбивается на различные последовательности. В качестве примера рассмотрим этот комментарий: "Я счастлив и у меня есть баланс между работой и жизнью".

  • Последовательность из одного слова: Я, я, счастливый, и, есть, работа, жизнь, баланс, ...
  • Последовательность из двух слов: Я, счастлив, счастлив и, и есть, ...
  • Последовательность из трех слов: ... и иметь работу, иметь трудовую жизнь, трудовую жизнь баланс. Затем каждая последовательность сопоставляется с ключевое слово словарем Glint. В этом примере ключевые слова "happy" и "work life balance" определяются как ключевые слова.

Ключевые слова оценки

После изоляции ключевое слово Glint присваивает ему оценку на основе его релевантности и значимости (т. е. полезности).

  • Для вычисления релевантности алгоритм оценки определяет частоту ключевое слово в срезе. Срез — это фрагмент данных, например результаты опроса в масштабах всей компании или результаты отфильтрованной группы в опросе. Более высокая частота ключевое слово в срезе указывает на более высокую релевантность, что увеличивает его оценку.
  • Чтобы определить значение, ключевое слово отображается только в том случае, если он уникален по сравнению с другими срезами или опросами. Алгоритм оценки определяет частоту ключевое слово во всех комментариях к Glint во всех компаниях. Здесь более высокая частота ключевое слово указывает на более низкую оценку, что снижает его оценку. Ключевые слова с наивысшими оценками проходят окончательный процесс сортировки, чтобы определить, какие из них в конечном итоге представлены в ключевое слово облаке.

Сортировка ключевых слов

Чтобы правильно представить результаты опроса, ключевое слово облако должно представлять как можно больше комментариев опроса. Также должен существовать баланс между ключевыми словами из всех комментариев и ключевыми словами, которые по-прежнему являются наиболее значимыми.

Например, некоторые ключевые слова (управление, общение, отзывы и т. д.) обычно имеют высокую частоту в комментариях в каждом срезе и во всех компаниях. Облака ключевых слов могут выглядеть одинаково практически в любом сценарии, что не полезно.

Для эффективной сортировки ключевых слов Glint использует оптимальный диапазон времени, в котором ключевое слово представлен в комментариях среза для включения в ключевое слово облаке. Этот диапазон называется охватом среза. Диапазон оптимального охвата среза не включает ключевые слова с наибольшей частотой. Цель заключается в том, чтобы включить часто встречающиеся ключевые слова с высокой оценкой, а не те, которые не настолько часто, чтобы они потеряли свое уникальное значение.

Glint помещает ключевые слова среза через окончательный процесс сортировки, где:

  1. Для рассмотрения рассматривается ключевое слово с наивысшей оценкой. Если он попадает в наиболее оптимальный диапазон охвата среза, он добавляется в ключевое слово облако.
  2. Затем комментарий со следующим ключевое слово с наивысшей оценкой сравнивается с оптимальным диапазоном охвата среза. И так далее...
  3. Так как не все ключевые слова соответствуют первому оптимальному диапазону охвата среза, Glint сопоставляет ключевые слова из оставшихся комментариев со следующим наиболее оптимальным диапазоном охвата среза.

Этот процесс сортировки повторяется до достижения целевого количества ключевых слов для включения. Благодаря этому процессу изоляции, оценки и сортировки Glint ключевое слово облака содержат ключевые слова, которые являются значимыми, часто встречающимися и уникальными.