Comportamento di un singolo enunciato

Speech-to-Text fornisce il modello latest_short per il riconoscimento vocale che consiste in singole espressioni. Questo può essere utile per le applicazioni in cui gli utenti emettono singoli comandi vocali anziché monologhi o dettature di lunga durata.

Quando viene utilizzato un riconoscitore con il modello latest_short per una richiesta di riconoscimento, Speech-to-Text interrompe il riconoscimento una volta rilevato che un'espressione è terminata. Speech-to-Text restituirà una risposta all'evento di attività vocale con il tipo END_OF_SINGLE_UTTERANCE seguito dai risultati della trascrizione.

Singola espressione e StreamingRecognize

Nel caso in cui venga selezionato un latest_short modello Recognizer per una richiesta StreamingRecognize, Speech-to-Text chiuderà lo stream automaticamente al termine dell'enunciato.

Con gli eventi di attività vocale

Nel caso in cui siano stati attivati anche gli eventi di attività vocale per una richiesta StreamingRecognize, Speech-to-Text restituirà comunque gli eventi di attività vocale di inizio/fine del parlato. Verranno comunque applicati i timeout dell'attività vocale per l'inizio del discorso. I timeout dell'attività vocale per la fine del discorso non verranno applicati, poiché lo stream verrà chiuso non appena termina l'enunciato.