Поддерживаемые теги SSML в Silero TTS: различия между версиями

Материал из Call Office Wiki
Перейти к навигации Перейти к поиску
 
(не показано 6 промежуточных версий 1 участника)
Строка 3: Строка 3:
== Разметка ==
== Разметка ==
Для использования разметки, текст должден быть обёрнут в корневой тег <speak>%s</speak>. Без него, встретив любые теги в тексте, сервер ответит ошибкой.
Для использования разметки, текст должден быть обёрнут в корневой тег <speak>%s</speak>. Без него, встретив любые теги в тексте, сервер ответит ошибкой.
Пример:
'<speak>Привет!</speak>'


== Ударение ==
== Ударение ==
"+" перед глаcной дает на неё ударение (акцент). Данную возможность можно использовать и в простом тексте, без корневого тега <speak>.
"+" перед глаcной дает на неё ударение (акцент). Данную возможность можно использовать и в простом тексте, без корневого тега <speak>.
== Пауза с таймером ==
Вы можете делать паузы в произнесении и упралять их продолжительностью при помощи тега
<break time="2000ms"/>


== Паузы разметки ==
== Паузы разметки ==
Строка 19: Строка 18:
   &lt;s&gt;Между предложениями.&lt;/s&gt;
   &lt;s&gt;Между предложениями.&lt;/s&gt;
  &lt;/p&gt;
  &lt;/p&gt;
== Пауза с таймером ==
Вы можете делать паузы в произнесении и упралять их продолжительностью при помощи тега
<break time="2000ms"/>
<break strength="x_weak">
<break strength="x-strong">
Весь список акцентуаций:
'x_weak': 25, 'weak': 75, 'medium': 150, 'strong': 300, 'x-strong': 1000
Пример
'<speak>Привет!<break time="2000ms"/>Как Ваши дела?</speak>'
'<speak>Привет!<break time="x-strong"/>Как Ваши дела?</speak>'


== Скорость ==
== Скорость ==
Строка 27: Строка 39:
Весь список скоростей:
Весь список скоростей:
  'x-slow': 0.5, 'slow': 0.8, 'medium': 1., 'fast': 1.2, 'x-fast': 1.5
  'x-slow': 0.5, 'slow': 0.8, 'medium': 1., 'fast': 1.2, 'x-fast': 1.5
Пример:
'<speak>Привет!<prosody rate="fast">Как Ваши дела?</prosody></speak>'


== Тональность ==
== Тональность ==
Строка 36: Строка 51:
  'x-low': 0.6, 'low': 0.8, 'medium': 1., 'high': 1.2, 'x-high': 1.4, 'robot': 0.
  'x-low': 0.6, 'low': 0.8, 'medium': 1., 'high': 1.2, 'x-high': 1.4, 'robot': 0.


== Акцентуация ==
Пример:
Вы можете управлять энергичностью произнесения (продолжительностью пауз между словами)
  '<speak>Привет!<prosody pitch="x-high">Как Ваши дела?</prosody></speak>'
  <break strength="x_weak">Очень вяло</break>
<break strength="x-strong">Очень бойко</break>
 
Весь список акцентуаций:
'x_weak': 25, 'weak': 75, 'medium': 150, 'strong': 300, 'x-strong': 1000

Текущая версия на 10:36, 27 июля 2022

Speech Synthesis Markup Language (SSML) - это язык разметки текста для управления синтезом речи.

Разметка

Для использования разметки, текст должден быть обёрнут в корневой тег <speak>%s</speak>. Без него, встретив любые теги в тексте, сервер ответит ошибкой.

Пример:

'<speak>Привет!</speak>'

Ударение

"+" перед глаcной дает на неё ударение (акцент). Данную возможность можно использовать и в простом тексте, без корневого тега <speak>.

Паузы разметки

<p>
 Длинные паузы между параграфами
</p>
<p>
  <s>Более короткие паузы.</s>
  <s>Между предложениями.</s>
</p>

Пауза с таймером

Вы можете делать паузы в произнесении и упралять их продолжительностью при помощи тега

<break time="2000ms"/>
<break strength="x_weak">
<break strength="x-strong">

Весь список акцентуаций:

'x_weak': 25, 'weak': 75, 'medium': 150, 'strong': 300, 'x-strong': 1000

Пример

'<speak>Привет!<break time="2000ms"/>Как Ваши дела?</speak>'
'<speak>Привет!<break time="x-strong"/>Как Ваши дела?</speak>'

Скорость

Вы можете упралять скоростью произнесения отдельных фрагментов текста

<prosody rate="x-slow">Очень медленно</prosody>
<prosody rate="fast">Быстро</prosody>

Весь список скоростей:

'x-slow': 0.5, 'slow': 0.8, 'medium': 1., 'fast': 1.2, 'x-fast': 1.5

Пример:

'<speak>Привет!<prosody rate="fast">Как Ваши дела?</prosody></speak>'

Тональность

Вы можете управлять высотой тональности произнесения (от писка до баса)

<prosody pitch="x-high">Высокий тон</prosody>
<prosody pitch="medium">Нормальный тон</prosody>

Весь список тональностей:

'x-low': 0.6, 'low': 0.8, 'medium': 1., 'high': 1.2, 'x-high': 1.4, 'robot': 0.

Пример:

'<speak>Привет!<prosody pitch="x-high">Как Ваши дела?</prosody></speak>'