Объект Device/Методы/InitSpeechRecognition: различия между версиями

Материал из Call Office Wiki
Перейти к навигации Перейти к поиску
Строка 18: Строка 18:
=== Распознавание голоса с использованием сервиса Google ===
=== Распознавание голоса с использованием сервиса Google ===
Для распознавания используя сервис '''Google''', значение параметра должно начинаться со слова '''Google''', за которым могут идти параметры:
Для распознавания используя сервис '''Google''', значение параметра должно начинаться со слова '''Google''', за которым могут идти параметры:
* '''Key''' - API Key сервиса Google. В текущей версии потокового распознавания не используется.
* '''Key''' - API Key сервиса Google.
* '''Language''' - язык распознавания. Полный список доступных языков [https://cloud.google.com/speech/docs/languages здесь]. По умолчанию русский: "ru-RU".
* '''Language''' - язык распознавания. Полный список доступных языков [https://cloud.google.com/speech/docs/languages здесь]. По умолчанию русский: "ru-RU".
* '''SingleUtterance''' - распознавание одной фразы. По умолчанию выключено.
* '''SingleUtterance''' - распознавание одной фразы. По умолчанию выключено.
Строка 25: Строка 25:
Для включения распознавания Google необходимо:
Для включения распознавания Google необходимо:
# Обратиться в [http://www.calloffice.ru/Autor/ службу технической поддержки] и получить специальную версию библиотеки, в которой включена возможность распознавания Google.
# Обратиться в [http://www.calloffice.ru/Autor/ службу технической поддержки] и получить специальную версию библиотеки, в которой включена возможность распознавания Google.
# Зарегистрироваться в [https://console.cloud.google.com/ Google Cloud Platform] создать проект и включить в нем Google Cloud Speech API. Затем нужно создать ключ сервисного аккаунта в формате json и сохранить файл с именем application_default_credentials.json на диске в один из каталогов:
# Зарегистрироваться в [https://console.cloud.google.com/ Google Cloud Platform] создать проект и включить в нем Google Cloud Speech API. Затем нужно создать ключ API Key или ключ сервисного аккаунта в формате json и сохранить в файл с именем application_default_credentials.json на диске в один из каталогов:
#* Каталог C:\Users\All Users\Call Office\
#* Каталог C:\Users\All Users\Call Office\
#* Каталог google по умолчанию: %APPDATA%\gcloud\ (обычно это: C:\Users\<имя пользователя>\AppData\Roaming\gcloud\)
#* Каталог google по умолчанию: %APPDATA%\gcloud\ (обычно это: C:\Users\<имя пользователя>\AppData\Roaming\gcloud\)

Версия 09:16, 17 июля 2017

Метод InitSpeechRecognition» подготавливает распознавание голоса.

Синтаксис

InitSpeechRecognition ([BSTR Parameters])

Параметры

Доступны три способа распознавание голоса - при помощи широко известной библиотеки Sphinx и ее голосовых баз, при помощи сервиса Google или Yandex.

Распознавание голоса с использованием библиотеки Sphinx

Для использования распознавания Sphinx в качестве параметра достаточно указать расположение файла конфигурации словаря. Можно указать как абсолютное расположение, так и расположение относительно каталога установки Call Office. Например, если Call Office установлен в папку C:\Program Files\Call Office, а базы для распознавания в подкаталоге SpeechRecognition, то достаточно указать только относительный путь SpeechRecognition\\init.cfg:

  InitSpeechRecognition ("SpeechRecognition\\init.cfg")

Распознавание голоса с использованием сервиса Google

Для распознавания используя сервис Google, значение параметра должно начинаться со слова Google, за которым могут идти параметры:

  • Key - API Key сервиса Google.
  • Language - язык распознавания. Полный список доступных языков здесь. По умолчанию русский: "ru-RU".
  • SingleUtterance - распознавание одной фразы. По умолчанию выключено.
  • InterimResults - получать промежуточные результаты распознавания. По умолчанию выключено.
  InitSpeechRecognition ("Google;SingleUtterance=1")

Для включения распознавания Google необходимо:

  1. Обратиться в службу технической поддержки и получить специальную версию библиотеки, в которой включена возможность распознавания Google.
  2. Зарегистрироваться в Google Cloud Platform создать проект и включить в нем Google Cloud Speech API. Затем нужно создать ключ API Key или ключ сервисного аккаунта в формате json и сохранить в файл с именем application_default_credentials.json на диске в один из каталогов:
    • Каталог C:\Users\All Users\Call Office\
    • Каталог google по умолчанию: %APPDATA%\gcloud\ (обычно это: C:\Users\<имя пользователя>\AppData\Roaming\gcloud\)
    • Любой каталог на который указывает переменная окружения GOOGLE_APPLICATION_CREDENTIALS
  3. В некоторых случаях дополнительно нужно установить Распространяемый пакет Visual C++ для Visual Studio 2015.

Для получения триальной версии необходимо иметь google-аккаунт и пройти регистрацию на странице получения триала.

Распознавание голоса с использованием сервиса Yandex

Для распознавания используя сервис Yandex, значение параметра должно начинаться со слова Yandex, за которым могут идти параметры:

  • Key - API Key сервиса Yandex. Обязательный параметр.
  InitSpeechRecognition ("Yandex;Key=<ваш ключ>")

Описание

Метод подключает словарь со словами, распознаваемыми после команды StartSpeechRecognition.

Примеры

Пример на JavaScript
var Device = new ActiveXObject ("CallOffice.Device");
Device.Open ();
Device.InitSpeechRecognition ();
Device.LogFile = 'CallOffice.log';
Device.LogLevel = 255;
var Words = 'да, нет, выход, ноль, один, два, три, четыре, пять, шесть, семь, восемь, девять, десять';
var StopWords = 'выход';
Device.StartSpeechRecognition (Words, StopWords);
Device.Listen (30);
Device.StopSpeechRecognition (); 
if (Device.VoiceCommand) alert ('Вы сказали слово ' + Device.VoiceCommand);
else alert ('Ничего не произнесено');
Device.Close ();
Пример на VBScript
Dim Device
Set Device = CreateObject ("CallOffice.Device")
Device.Open
Device.LogFile = "CallOffice.log"
Device.LogLevel = 255
Device.InitSpeechRecognition
Words = "да, нет, выход, ноль, один, два, три, четыре, пять, шесть, семь, восемь, девять, десять"
StopWords = "выход"
Device.StartSpeechRecognition Words, StopWords
Device.Listen 30
Device.StopSpeechRecognition

If Device.VoiceCommand Then 
   MsgBox "Вы сказали слово ", Device.VoiceCommand
Else 
   MsgBox "Ничего не произнесено."
End If

Device.Close

Назад к методам объекта Device.