Добавить звук к голосовому сообщению (версия 3.xx): различия между версиями

Материал из Call Office Wiki
Перейти к навигации Перейти к поиску
 
(не показано 28 промежуточных версий 3 участников)
Строка 1: Строка 1:
Страница добавления звуков к голосовому сообщению.
==Как попасть на страницу настроек==
''На странице запуска в меню слева при остановленном сценарии кликнуть на пункт '''«Звуковое сообщение»''', затем нажать кнопку '''«Новый звук»'''.''
 
==Описание настройки==
{|
|-
|style="width:75%;"|Воспроизведение звукового сообщения абоненту — одна из важнейших функций нашей программы. В настоящее время наш программный продукт может произносить:
*звуковые файлы в формате *.wav и *.mp3 (начиная с версии 3.05), имя файла может быть указано в интерфейсе программы, получено из поля базы данных или вычислено выражением;
*даты, денежные суммы, номера телефонов с возможностью получения их значения из базы данных;
*синтезированный текст при помощи установленных на компьютере голосовых машин или онлайн сервиса Google (начиная с версии 3.05), в том числе с предварительной обработкой для произнесения дат, денежных сумм и т.д.
|style="width:25%;"|__TOC__
|}
 
== Звуковой файл ==


[[Файл:WikiSoundAddFile.png]]
[[Файл:WikiSoundAddFile.png]]
Строка 10: Строка 23:


Нажмите кнопку [[Файл:Play.png]], чтобы прослушать выбранный звук.
Нажмите кнопку [[Файл:Play.png]], чтобы прослушать выбранный звук.
== Выражение ==


[[Файл:WikiSoundAddCombine.png]]
[[Файл:WikiSoundAddCombine.png]]
Строка 17: Строка 32:
Для произнесения результата выражения можно использовать несколько способов:
Для произнесения результата выражения можно использовать несколько способов:


'''Комбинирование'''. Позволяет преобразовывать значение выражения в даты, суммы и т.д. Для произнесения чисел и сумм в настоящее время используются русский, английский и казахский языки. Для произнесения дат – русский и английский.
=== Комбинирование ===
Позволяет преобразовывать значение выражения в даты, суммы и т.д. Для произнесения чисел и сумм в настоящее время используются русский, английский и казахский языки. Для произнесения дат – русский и английский.
 
[[Файл:WikiAddSoundCombine.png]]


Можно задать тип преобразования. Количественный: один, два, три и т.д. Порядковый: первый, второй и т.д.
Можно задать тип преобразования. Количественный: один, два, три и т.д. Порядковый: первый, второй и т.д.
Строка 29: Строка 47:
'''Допустимые символы в формате и их значения''':
'''Допустимые символы в формате и их значения''':


'''9''' - цифра; '''$''' - денежная единица; '''.''' - разделитель разрядов;
'''9''' - цифра; '''0''' - цифра c ведущими нулями; '''$''' - денежная единица; '''.''' - разделитель разрядов;


'''dd''' - день; '''mm''' - месяц; '''yyyy''' - год;
'''dd''' - день; '''mm''' - месяц; '''yyyy''' - год;
Строка 35: Строка 53:
'''hh''' - час; '''mi''' - минута; '''ss''' - секунда.
'''hh''' - час; '''mi''' - минута; '''ss''' - секунда.


'''Синтез'''. При синтезе сообщений в обязательном порядке возьмите фразу в кавычки, иначе программа обрабатывает её как переменные, что приводит к ошибке при работе сценария.
'''!''' - восклицательный знак в начале строки формата, означает привести формат к длине значения выражения. Если длина значения выражения будет больше чем размер формата, формат будет дополнен справа несколько раз до достижения размера значения выражения. Если же размер формата больше чем длина значения выражения, формат будет усечен справа до размера значения выражения. Например, формат '''!00''' при значении выражения '''123456''' будет расширен до '''00 00 00'''. Формат '''!00 00 00 00 00''' при значении выражения '''12345''' будет урезан до '''0 00 00'''.
 
Символ '''9''' следует использовать в формате, если необходимо произнести обычное число, например, сумму задолженности. Например, число '''211100''' в формате '''999999''' будет произнесено как: '''Двести Одиннадцать Тысяч Сто'''. Если же необходимо произносить число как номер телефона, в формате следует использовать символ '''0'''. В этом случае число '''211100''' в формате '''00 00 00''' будет произнесено как: '''Двадцать Один Одиннадцать Ноль Ноль'''.
 
=== Синтез ===
  При синтезе сообщений обязательно возьмите фразу в кавычки, иначе будет возникать [[Часто Задаваемые Вопросы/Воспроизведение сообщений#В. При воспроизведении фразы при помощи голосовой машины появляется сообщение о синтаксической ошибке. |ошибка]].
 
[[Файл:WikiAddSoundSynthesis.png]]
 
До версии 3.05 для синтеза можно было использовать только установленную на компьютере пользователя [http://www.calloffice.ru/Article/golosovaja_mashina_sakrament голосовую машину]. Начиная с версии 3.05 для синтеза голоса помимо установленной на компьютере голосовой машины можно использовать сервис Google TTS. Именно этот сервис используется в [http://translate.google.ru/#ru/en/%D0%9F%D1%80%D0%B8%D0%B2%D0%B5%D1%82! Переводчике Google], если нажать кнопку «Прослушать».
 
  Для работы сервиса необходимо постоянное подключение к сети интернет.
  В этом режиме возможны ограничения на длину текста и/или количество запросов в единицу времени.
 
При использовании сервиса Google необходимо помнить об ограничениях, налагаемых им. Например, сообщение длиной более 100 символов вызовет [[Часто Задаваемые Вопросы/Воспроизведение сообщений#В. При синтезировании текста через Google TTS выскакивает ошибка: «Ошибка GoogleTTS: Ошибка при использовании сервиса Google TTS: Not Found.» |сообщение об ошибке]].
 
Начиная с версии 3.07 для синтеза можно использовать [https://speechkit.yandex.ru/dev YandexSpeechKit Cloud]. Для использования сервиса Яндекс необходим ключ, который указывается в соответствующем поле:
 
Начиная с версии 3.21 для синтеза голосового сообщения можно использовать как обычный текст, так и текст в формате [https://www.w3.org/TR/speech-synthesis/ SSML] при использовании голосовых машин [https://speechkit.yandex.ru/dev YandexSpeechKit Cloud] или [https://cloud.google.com/text-to-speech/docs/reference/rest/v1/text/synthesize?hl=ru Google Cloud Text-To-Speach]. Для включения этой возможности текст должен быть заключен внутри тегов <speak> и </speak>, например:
 
"<speak>Привет,<break time=\"2s\"/> как дела?</speak>"
 
Поддерживаемые теги [https://cloud.yandex.ru/docs/speechkit/tts/ssml YandexSpeechKit Cloud SSML] и [https://cloud.google.com/text-to-speech/docs/ssml?hl=ru и Google Cloud Text-To-Speach SSML].
 
[[Файл:WikiAddSoundSynthesisYandex.png]]
 
=== Комбинирование и синтез ===
При использовании комбинирования и синтеза, программа вычисляет и обрабатывает значение выражения таким же образом, как при использовании комбинирования, а произносит его при помощи голосовой машины или сервиса Google (начиная с версии 3.05).
 
[[Файл:WikiAddSoundCombineAndSynthesis.png]]


'''Выражение как звуковой файл'''. Берёт имя звукового файла из поля базы данных и произносит этот звуковой файл.
=== Выражение как звуковой файл ===
Программа берёт имя звукового файла из поля базы данных или вычисляет из выражения произносит этот звуковой файл. Как и выбранный в интерфейсе программы файл может быть в формате wav или mp3 (начиная с версии 3.05).


[[Файл:WikiSoundFieldAsFileName.png]]
[[Файл:WikiSoundFieldAsFileName.png]]


При выборе параметра «Использовать следующие символы как разделители» можно указывать несколько звуковых файлов в одной ячейке базы данных.
При выборе параметра «Использовать следующие символы как разделители» можно указывать несколько имён файлов, разделяя их указанными символами.


Для страницы "Сообщение для абонента после нажатия клавиши" при обработке DTMF-сигналов предопределена переменная PressedKey. На рисунке ниже вместо неё будет подставляться значение нажатой клавиши. То есть, если клиент нажал 0, будет произнесён файл Filename0.wav, а если 6, то Filename6.wav.
Для страницы "Сообщение для абонента после нажатия клавиши" при обработке DTMF-сигналов предопределена переменная PressedKey. На рисунке ниже вместо неё будет подставляться значение нажатой клавиши. То есть, если клиент нажал 0, будет произнесён файл Filename0.wav, а если 6, то Filename6.wav.


Конечно же, соответствующие файлы необходимо заранее поместить в папку Sound с установленным Call Office либо в папке, куда указывает свойство [[Объект_Device/Свойства/SoundPath|SoundPath]].
Конечно же, соответствующие файлы необходимо заранее поместить в папку Sound с установленным Call Office либо в папку, на которую  указывает свойство [[Объект_Device/Свойства/SoundPath|SoundPath]].


[[Файл:WikiDTMFSound.png]]
[[Файл:WikiDTMFSound.png]]


[[Category:Помощь (версия 3.xx)]]
[[Category:Помощь (версия 3.xx)]]

Текущая версия на 17:53, 1 февраля 2022

Как попасть на страницу настроек

На странице запуска в меню слева при остановленном сценарии кликнуть на пункт «Звуковое сообщение», затем нажать кнопку «Новый звук».

Описание настройки

Воспроизведение звукового сообщения абоненту — одна из важнейших функций нашей программы. В настоящее время наш программный продукт может произносить:
  • звуковые файлы в формате *.wav и *.mp3 (начиная с версии 3.05), имя файла может быть указано в интерфейсе программы, получено из поля базы данных или вычислено выражением;
  • даты, денежные суммы, номера телефонов с возможностью получения их значения из базы данных;
  • синтезированный текст при помощи установленных на компьютере голосовых машин или онлайн сервиса Google (начиная с версии 3.05), в том числе с предварительной обработкой для произнесения дат, денежных сумм и т.д.

Звуковой файл

WikiSoundAddFile.png

Можно добавить звуковой файл в формате wav к сообщению.

Нажмите кнопку Tree.png для выбора звуков из папки Call Office или установленных голосовых библиотек.

Нажмите кнопку «Обзор», чтобы указать файл в другой папке компьютера.

Нажмите кнопку Play.png, чтобы прослушать выбранный звук.

Выражение

WikiSoundAddCombine.png

Выражение позволяет добавлять к голосовому сообщению произвольные данные, в том числе из базы данных, используемой для работы сценария. Выбрав в выпадающем списке поле базы данных, нажмите на кнопку Insert.png, чтобы добавить его название в строку выражения.

Для произнесения результата выражения можно использовать несколько способов:

Комбинирование

Позволяет преобразовывать значение выражения в даты, суммы и т.д. Для произнесения чисел и сумм в настоящее время используются русский, английский и казахский языки. Для произнесения дат – русский и английский.

WikiAddSoundCombine.png

Можно задать тип преобразования. Количественный: один, два, три и т.д. Порядковый: первый, второй и т.д.

Можно задать денежную единицу. Для каждого языка денежные единицы различаются.

Формат поля определяет, в каком виде или какую часть значения поля необходимо произнести.

Например, если поле [Дата] содержит «05.06.2013», а в поле формата записано «yyyy», будет произнесён только год.

Допустимые символы в формате и их значения:

9 - цифра; 0 - цифра c ведущими нулями; $ - денежная единица; . - разделитель разрядов;

dd - день; mm - месяц; yyyy - год;

hh - час; mi - минута; ss - секунда.

! - восклицательный знак в начале строки формата, означает привести формат к длине значения выражения. Если длина значения выражения будет больше чем размер формата, формат будет дополнен справа несколько раз до достижения размера значения выражения. Если же размер формата больше чем длина значения выражения, формат будет усечен справа до размера значения выражения. Например, формат !00 при значении выражения 123456 будет расширен до 00 00 00. Формат !00 00 00 00 00 при значении выражения 12345 будет урезан до 0 00 00.

Символ 9 следует использовать в формате, если необходимо произнести обычное число, например, сумму задолженности. Например, число 211100 в формате 999999 будет произнесено как: Двести Одиннадцать Тысяч Сто. Если же необходимо произносить число как номер телефона, в формате следует использовать символ 0. В этом случае число 211100 в формате 00 00 00 будет произнесено как: Двадцать Один Одиннадцать Ноль Ноль.

Синтез

  При синтезе сообщений обязательно возьмите фразу в кавычки, иначе будет возникать ошибка.

WikiAddSoundSynthesis.png

До версии 3.05 для синтеза можно было использовать только установленную на компьютере пользователя голосовую машину. Начиная с версии 3.05 для синтеза голоса помимо установленной на компьютере голосовой машины можно использовать сервис Google TTS. Именно этот сервис используется в Переводчике Google, если нажать кнопку «Прослушать».

  Для работы сервиса необходимо постоянное подключение к сети интернет.
  В этом режиме возможны ограничения на длину текста и/или количество запросов в единицу времени. 

При использовании сервиса Google необходимо помнить об ограничениях, налагаемых им. Например, сообщение длиной более 100 символов вызовет сообщение об ошибке.

Начиная с версии 3.07 для синтеза можно использовать YandexSpeechKit Cloud. Для использования сервиса Яндекс необходим ключ, который указывается в соответствующем поле:

Начиная с версии 3.21 для синтеза голосового сообщения можно использовать как обычный текст, так и текст в формате SSML при использовании голосовых машин YandexSpeechKit Cloud или Google Cloud Text-To-Speach. Для включения этой возможности текст должен быть заключен внутри тегов <speak> и </speak>, например:

"<speak>Привет,<break time=\"2s\"/> как дела?</speak>"

Поддерживаемые теги YandexSpeechKit Cloud SSML и и Google Cloud Text-To-Speach SSML.

WikiAddSoundSynthesisYandex.png

Комбинирование и синтез

При использовании комбинирования и синтеза, программа вычисляет и обрабатывает значение выражения таким же образом, как при использовании комбинирования, а произносит его при помощи голосовой машины или сервиса Google (начиная с версии 3.05).

WikiAddSoundCombineAndSynthesis.png

Выражение как звуковой файл

Программа берёт имя звукового файла из поля базы данных или вычисляет из выражения произносит этот звуковой файл. Как и выбранный в интерфейсе программы файл может быть в формате wav или mp3 (начиная с версии 3.05).

WikiSoundFieldAsFileName.png

При выборе параметра «Использовать следующие символы как разделители» можно указывать несколько имён файлов, разделяя их указанными символами.

Для страницы "Сообщение для абонента после нажатия клавиши" при обработке DTMF-сигналов предопределена переменная PressedKey. На рисунке ниже вместо неё будет подставляться значение нажатой клавиши. То есть, если клиент нажал 0, будет произнесён файл Filename0.wav, а если 6, то Filename6.wav.

Конечно же, соответствующие файлы необходимо заранее поместить в папку Sound с установленным Call Office либо в папку, на которую указывает свойство SoundPath.

WikiDTMFSound.png