Al momento el SSML se utiliza en la versión original de Voice, no así en la 2.0. dado que el feature está en proceso de implementación.
Es un lenguaje estandarizado que permite agregar y controlar a través de etiquetas atributos como: pronunciación, entonación, pausas, emociones, velocidad del habla, entre otros. Dichas etiquetas descriptivas del atributo se insertarán dentro del contenido de la respuesta de AgentBot y Voice se encargará luego de reproducirlas al momento de dar la respuesta.
Ejemplos de SSML
1. Identificación de texto mejorado con SSML

2. Añadir una Pausa

3. Añadir énfasis a frases o palabras

4. Control del volumen, velocidad del habla y tono

5. Reproducción de audios desde una URL

Para conocer más al respecto puedes ingresar aquí.