La deriva della trascrizione è la distorsione graduale di un flusso live da voce a testo causata da piccoli errori di riconoscimento che si accumulano nel tempo. Un modello può saltare una parola, confondere nomi o numeri, oppure appianare una pausa, e questi errori possono sommarsi man mano che la trascrizione viene aggiornata in tempo reale. Il risultato è un output che sembra ancora plausibile, ma non corrisponde più a ciò che è stato realmente detto.
Nella sicurezza informatica, la deriva è importante perché le trascrizioni sono spesso trattate come input affidabile per ricerca, registrazione, automazione o uso di strumenti. Un numero sbagliato, un comando errato o una frase di approvazione possono attivare l'azione sbagliata, soprattutto negli agenti vocali e nei flussi di lavoro dei call center. Gli aggressori possono sfruttare audio rumoroso, accenti o sovrapposizione di voci per deviare la trascrizione, oppure nascondere istruzioni nel parlato di sottofondo. Le difese includono trattare le trascrizioni come non fidate, richiedere la conferma umana per le azioni sensibili e confrontare i segmenti trascritti con l'audio quando l'accuratezza è critica.



