KWS: различия между версиями

Материал из Call Office Wiki
Перейти к навигации Перейти к поиску
 
Строка 1: Строка 1:
'''KWS (keyword search)''' — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx.
'''KWS (keyword search)''' — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx.


Позволяет задать ключевые слова, который будут использоваться при распознавании. Использование этой технологии должно начинаться с ключевого слова #KWS, далее идут параметры и распознаваемые слова.
Позволяет задать ключевые слова, который будут использоваться при распознавании. При использовании этой технологии параметр распознавания должен начинаться с ключевого слова '''#KWS''' за которым следуют параметры и слова, которые необходимо распознавать.


==Пример==
==Пример==
Строка 10: Строка 10:
  один, два, три, четыре, пять  
  один, два, три, четыре, пять  


В этом случае задается порог определения ключевых слов задается для всех слов параметром '''kws_threshold''' и слова, которые необходимо распознавать. Параметр начинается с символа - за котором следует имя параметра. Допустимы следующие параметры:
В этом случае задается порог определения ключевых слов задается для всех слов параметром '''kws_threshold''' и слова, которые необходимо распознавать. Каждый параметр должен находиться на отдельной строке и начинаться с символа - за котором следует имя параметра. Допустимы следующие параметры:


* '''kws_threshold''' - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1.
* '''kws_threshold''' - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1.
Строка 17: Строка 17:
* '''kws''' - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются.
* '''kws''' - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются.


Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова:
Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова внутри символов //:


  #KWS
  #KWS

Текущая версия на 11:59, 17 июня 2019

KWS (keyword search) — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx.

Позволяет задать ключевые слова, который будут использоваться при распознавании. При использовании этой технологии параметр распознавания должен начинаться с ключевого слова #KWS за которым следуют параметры и слова, которые необходимо распознавать.

Пример

Рассмотрим простой пример KWS поиска:

#KWS
-kws_threshold 1e-25
один, два, три, четыре, пять 

В этом случае задается порог определения ключевых слов задается для всех слов параметром kws_threshold и слова, которые необходимо распознавать. Каждый параметр должен находиться на отдельной строке и начинаться с символа - за котором следует имя параметра. Допустимы следующие параметры:

  • kws_threshold - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1.
  • kws_delay - задержка перед определением лучшего результата распознавания. По умолчанию 10.
  • kws_plp - вероятность определения ключевых слов. По умолчанию 1e-1.
  • kws - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются.

Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова внутри символов //:

#KWS
один, два/1e-15/, три, четыре/1e-5/, пять

В этом примере для слов два и четыре указаны отдельные пороги определения ключевого слова. Строка с символом # в начале считается комментарием.