KWS: различия между версиями
Jugin (обсуждение | вклад) (Новая страница: «'''KWS (keyword search)''' — технология распознавания ключевых слов используемая в локальной систе…») |
Jugin (обсуждение | вклад) |
||
(не показана 1 промежуточная версия этого же участника) | |||
Строка 1: | Строка 1: | ||
'''KWS (keyword search)''' — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx. | '''KWS (keyword search)''' — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx. | ||
Позволяет задать ключевые слова, который будут использоваться при распознавании. | Позволяет задать ключевые слова, который будут использоваться при распознавании. При использовании этой технологии параметр распознавания должен начинаться с ключевого слова '''#KWS''' за которым следуют параметры и слова, которые необходимо распознавать. | ||
==Пример | ==Пример== | ||
Рассмотрим простой пример KWS поиска: | Рассмотрим простой пример KWS поиска: | ||
Строка 10: | Строка 10: | ||
один, два, три, четыре, пять | один, два, три, четыре, пять | ||
В этом случае задается порог определения ключевых слов параметром '''kws_threshold''' и слова, которые необходимо распознавать. | В этом случае задается порог определения ключевых слов задается для всех слов параметром '''kws_threshold''' и слова, которые необходимо распознавать. Каждый параметр должен находиться на отдельной строке и начинаться с символа - за котором следует имя параметра. Допустимы следующие параметры: | ||
Допустимы следующие параметры: | |||
* '''kws_threshold''' - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1. | * '''kws_threshold''' - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1. | ||
* '''kws_delay''' - задержка перед определением лучшего результата распознавания. По умолчанию 10. | * '''kws_delay''' - задержка перед определением лучшего результата распознавания. По умолчанию 10. | ||
* '''kws_plp''' - вероятность определения ключевых слов. По умолчанию 1e-1. | * '''kws_plp''' - вероятность определения ключевых слов. По умолчанию 1e-1. | ||
* '''kws''' - файл в кодировке UTF-8 содержащий ключевые слова. | * '''kws''' - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются. | ||
Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова внутри символов //: | |||
#KWS | |||
один, два/1e-15/, три, четыре/1e-5/, пять | |||
В этом примере для слов '''два''' и '''четыре''' указаны отдельные пороги определения ключевого слова. | |||
Строка с символом # в начале считается комментарием. |
Текущая версия на 11:59, 17 июня 2019
KWS (keyword search) — технология распознавания ключевых слов используемая в локальной системе распознавания Sphinx.
Позволяет задать ключевые слова, который будут использоваться при распознавании. При использовании этой технологии параметр распознавания должен начинаться с ключевого слова #KWS за которым следуют параметры и слова, которые необходимо распознавать.
Пример
Рассмотрим простой пример KWS поиска:
#KWS -kws_threshold 1e-25 один, два, три, четыре, пять
В этом случае задается порог определения ключевых слов задается для всех слов параметром kws_threshold и слова, которые необходимо распознавать. Каждый параметр должен находиться на отдельной строке и начинаться с символа - за котором следует имя параметра. Допустимы следующие параметры:
- kws_threshold - порог определения ключевого слова. Может принимать значения от 1 до 1e-50, по умолчанию 1.
- kws_delay - задержка перед определением лучшего результата распознавания. По умолчанию 10.
- kws_plp - вероятность определения ключевых слов. По умолчанию 1e-1.
- kws - файл в кодировке UTF-8 содержащий ключевые слова. Если используется этот режим остальные параметры игнорируются.
Ключевые слова могут быть разделены переводом строки или запятой. За ключевым словом можно указать порог определения ключевого слова внутри символов //:
#KWS один, два/1e-15/, три, четыре/1e-5/, пять
В этом примере для слов два и четыре указаны отдельные пороги определения ключевого слова. Строка с символом # в начале считается комментарием.