KWS
KWS (keyword search) — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx.
Позволяет задать ключевые слова, который будут использоваться при распознавании. При использовании этой технологии параметр распознавания должен начинаться с ключевого слова #KWS за которым следуют параметры и слова, которые необходимо распознавать.
Пример
Рассмотрим простой пример KWS поиска:
#KWS -kws_threshold 1e-25 один, два, три, четыре, пять
В этом случае задается порог определения ключевых слов задается для всех слов параметром kws_threshold и слова, которые необходимо распознавать. Каждый параметр должен находиться на отдельной строке и начинаться с символа - за котором следует имя параметра. Допустимы следующие параметры:
- kws_threshold - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1.
- kws_delay - задержка перед определением лучшего результата распознавания. По умолчанию 10.
- kws_plp - вероятность определения ключевых слов. По умолчанию 1e-1.
- kws - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются.
Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова внутри символов //:
#KWS один, два/1e-15/, три, четыре/1e-5/, пять
В этом примере для слов два и четыре указаны отдельные пороги определения ключевого слова. Строка с символом # в начале считается комментарием.