KWS

Материал из Call Office Wiki
Перейти к навигации Перейти к поиску

KWS (keyword search) — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx.

Позволяет задать ключевые слова, который будут использоваться при распознавании. При использовании этой технологии параметр распознавания должен начинаться с ключевого слова #KWS за которым следуют параметры и слова, которые необходимо распознавать.

Пример

Рассмотрим простой пример KWS поиска:

#KWS
-kws_threshold 1e-25
один, два, три, четыре, пять 

В этом случае задается порог определения ключевых слов задается для всех слов параметром kws_threshold и слова, которые необходимо распознавать. Каждый параметр должен находиться на отдельной строке и начинаться с символа - за котором следует имя параметра. Допустимы следующие параметры:

  • kws_threshold - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1.
  • kws_delay - задержка перед определением лучшего результата распознавания. По умолчанию 10.
  • kws_plp - вероятность определения ключевых слов. По умолчанию 1e-1.
  • kws - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются.

Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова внутри символов //:

#KWS
один, два/1e-15/, три, четыре/1e-5/, пять

В этом примере для слов два и четыре указаны отдельные пороги определения ключевого слова. Строка с символом # в начале считается комментарием.