KWS: различия между версиями
Jugin (обсуждение | вклад) |
Jugin (обсуждение | вклад) |
||
Строка 1: | Строка 1: | ||
'''KWS (keyword search)''' — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx. | '''KWS (keyword search)''' — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx. | ||
Позволяет задать ключевые слова, который будут использоваться при распознавании. | Позволяет задать ключевые слова, который будут использоваться при распознавании. При использовании этой технологии параметр распознавания должен начинаться с ключевого слова '''#KWS''' за которым следуют параметры и слова, которые необходимо распознавать. | ||
==Пример== | ==Пример== | ||
Строка 10: | Строка 10: | ||
один, два, три, четыре, пять | один, два, три, четыре, пять | ||
В этом случае задается порог определения ключевых слов задается для всех слов параметром '''kws_threshold''' и слова, которые необходимо распознавать. | В этом случае задается порог определения ключевых слов задается для всех слов параметром '''kws_threshold''' и слова, которые необходимо распознавать. Каждый параметр должен находиться на отдельной строке и начинаться с символа - за котором следует имя параметра. Допустимы следующие параметры: | ||
* '''kws_threshold''' - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1. | * '''kws_threshold''' - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1. | ||
Строка 17: | Строка 17: | ||
* '''kws''' - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются. | * '''kws''' - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются. | ||
Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова: | Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова внутри символов //: | ||
#KWS | #KWS |
Текущая версия на 11:59, 17 июня 2019
KWS (keyword search) — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx.
Позволяет задать ключевые слова, который будут использоваться при распознавании. При использовании этой технологии параметр распознавания должен начинаться с ключевого слова #KWS за которым следуют параметры и слова, которые необходимо распознавать.
Пример
Рассмотрим простой пример KWS поиска:
#KWS -kws_threshold 1e-25 один, два, три, четыре, пять
В этом случае задается порог определения ключевых слов задается для всех слов параметром kws_threshold и слова, которые необходимо распознавать. Каждый параметр должен находиться на отдельной строке и начинаться с символа - за котором следует имя параметра. Допустимы следующие параметры:
- kws_threshold - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1.
- kws_delay - задержка перед определением лучшего результата распознавания. По умолчанию 10.
- kws_plp - вероятность определения ключевых слов. По умолчанию 1e-1.
- kws - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются.
Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова внутри символов //:
#KWS один, два/1e-15/, три, четыре/1e-5/, пять
В этом примере для слов два и четыре указаны отдельные пороги определения ключевого слова. Строка с символом # в начале считается комментарием.