Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Speech-to-Text fornisce il modello latest_short per il riconoscimento vocale
che consiste in singole espressioni. Questo può essere utile per le applicazioni in cui gli utenti
emettono singoli comandi vocali anziché monologhi o
dettature di lunga durata.
Quando viene utilizzato un riconoscitore con il modello latest_short per una richiesta di riconoscimento, Speech-to-Text interrompe il riconoscimento una volta rilevato che un'espressione è terminata. Speech-to-Text restituirà una risposta all'evento di attività vocale
con il tipo END_OF_SINGLE_UTTERANCE seguito dai
risultati della trascrizione.
Singola espressione e StreamingRecognize
Nel caso in cui venga selezionato un latest_short modello Recognizer
per una richiesta StreamingRecognize, Speech-to-Text chiuderà
lo stream automaticamente al termine dell'enunciato.
Con gli eventi di attività vocale
Nel caso in cui siano stati attivati anche gli eventi di attività vocale per una
richiesta StreamingRecognize, Speech-to-Text restituirà comunque gli eventi di attività vocale
di inizio/fine del parlato.
Verranno comunque applicati i timeout dell'attività vocale per l'inizio del discorso. I timeout dell'attività vocale per la fine del discorso non verranno applicati, poiché lo stream verrà chiuso non appena termina l'enunciato.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[],[],null,["# Single utterance behavior\n\n| **Preview**\n|\n|\n| This product or feature is subject to the \"Pre-GA Offerings Terms\" in the General Service Terms section\n| of the [Service Specific Terms](/terms/service-terms#1).\n|\n| Pre-GA products and features are available \"as is\" and might have limited support.\n|\n| For more information, see the\n| [launch stage descriptions](/products#product-launch-stages).\n\nSpeech-to-Text provides the `latest_short` model for recognizing speech that\nconsists of single utterances. This may be useful for applications where users\nare issuing single voice commands as opposed to long-form monologue or\ndictation.\n\nWhen a recognizer with the `latest_short` model is used for a recognition\nrequest, Speech-to-Text will stop performing recognition once it detects\nan utterance has finished. Speech-to-Text will return a speech activity\nevent response with the type `END_OF_SINGLE_UTTERANCE` followed by the\ntranscription results.\n\nSingle utterance and StreamingRecognize\n---------------------------------------\n\nIn the case where a `latest_short` model [`Recognizer`](/speech-to-text/v2/docs/reference/rest/v2/projects.locations.recognizers#Recognizer)\nis selected for a `StreamingRecognize` request, Speech-to-Text will close\nthe stream automatically after the utterance has ended.\n\n### With voice activity events\n\nIn the case where voice activity events have also been enabled for a\nStreamingRecognize request, Speech-to-Text will still return speech\nbegin/end voice activity events.\nVoice activity timeouts for speech begin will still be applied. Voice activity\ntimeouts for speech end will not be applied, since the stream will be closed as\nsoon as the utterance ends."]]