Recensione di Microsoft Azure: elaborazione vocale all'avanguardia

Microsoft Azure Speech to Text è una delle piattaforme di riconoscimento vocale più avanzate in circolazione. Come parte della gamma di prodotti Cognitive Speech Services di Microsoft, utilizza algoritmi di deep learning per superare la scarsa qualità del suono e può adattarsi a diversi stili di pronuncia per trascrizioni audio accurate. In questa recensione di Microsoft Azure Speech to Text, esamineremo da vicino questo servizio.

Vale la pena notare che Microsoft Azure Speech to Text non è un software di dettatura tradizionale di facile utilizzo. Si tratta invece di una piattaforma orientata agli sviluppatori progettata per aiutare le aziende a creare, testare e gestire i propri prodotti. Se desideri solo trascrivere un batch di file audio, le app alternative di sintesi vocale potrebbero essere un'opzione migliore. Dai un'occhiata alla nostra migliore guida al software di sintesi vocale per le migliori alternative.

Microsoft Azure Speech to Text: piani e prezzi

Utilizzando Microsoft Azure Speech to Text, puoi trascrivere fino a cinque ore di audio gratuitamente e creare un modello vocale personalizzato al mese. Tuttavia, con il piano gratuito, è disponibile solo una singola richiesta audio simultanea alla volta, il che significa che questa opzione non è praticabile per la maggior parte delle aziende.

La fatturazione del servizio vocale di Azure viene suddivisa in incrementi di un secondo.

Se desideri trascrivere più di un clip vocale contemporaneamente, dovrai eseguire l'aggiornamento al sistema di prezzi di Azure standard. Questo costa $ 1 l'ora di audio e supporta fino a 20 richieste simultanee. Sono previsti costi aggiuntivi se è necessario utilizzare un modello audio personalizzato o trascrivere file audio multicanale. Questi servizi extra costano rispettivamente $ 1,40 e $ 2,10 per ora audio.

Sebbene Microsoft elenchi i prezzi in un formato "per ora audio", come è lo standard del settore, la fatturazione è in realtà suddivisa in incrementi di un secondo, quindi non dovrai pagare per un tempo di elaborazione superiore a quello richiesto.

Microsoft Azure Speech to Text: caratteristiche

La caratteristica chiave di Azure Speech to Text è l'accesso che concede al potente sistema di elaborazione del linguaggio naturale di Microsoft. Negli ultimi anni, il discorso AI di Microsoft ha raggiunto diversi traguardi importanti. Ciò significa che ora può completare attività che prima erano impossibili per un servizio di riconoscimento vocale, come la trascrizione accurata di conversazioni incrociate durante conversazioni in piccoli gruppi.

Il servizio Microsoft Azure Speech to Text può integrarsi con Office 365 per una precisione ottimale.

Azure funziona con dozzine di lingue e dialetti e può essere addestrato, utilizzando modelli di riconoscimento vocale personalizzati, per adattarsi meglio allo stile di parola di un utente, al rumore ambientale di sottofondo e al vocabolario. Se la tua organizzazione è già impegnata nell'ecosistema di prodotti Microsoft, puoi sfruttare i dati di Office 365 degli utenti per migliorare la precisione del riconoscimento vocale per i termini specifici dell'organizzazione. E, soprattutto, questo può essere fatto senza compromettere la sicurezza dei dati perché Speech to Text può essere eseguito in locale.

Microsoft Azure Speech to Text: configurazione

Microsoft Azure è stato progettato per gli sviluppatori piuttosto che per i consumatori. Ciò significa che configurarlo è una procedura complessa e in qualche modo impegnativa che è meglio lasciare a qualcuno con una buona dose di know-how tecnico.

La configurazione di Azure non è esattamente semplice se non si ha esperienza di codifica.

Il modo più veloce per configurare Azure consiste nell'usare Azure Speech SDK in un linguaggio di programmazione come Java o C ++. Per questo, dovrai registrarti per un account Azure gratuito e creare un progetto vuoto nel tuo ambiente di sviluppo. Dovrai quindi utilizzare Microsoft Visual Studio e scrivere un breve programma per inizializzare l'oggetto SpeechRecognizer di Microsoft.

Microsoft Azure Speech to Text: interfaccia

Come altre piattaforme di trascrizione in blocco, Microsoft Azure Speech to Text è concepito per essere eseguito come interfaccia di programmazione di applicazioni (API), aggiunta ai programmi di Office 365 o integrata in nuove piattaforme e servizi. Per questo motivo, non esiste un'unica interfaccia di riconoscimento vocale di Azure. Ciò che l'utente finale vedrà dipende da come è stato integrato Azure Speech to Text.

Il portale online di Azure è intuitivo e facile da usare.

Nel frattempo, lo sviluppatore che gestisce Azure lo farà tramite il portale Azure online di Microsoft, che sembra moderno ed è facile da navigare. Sono necessari solo pochi minuti per individuare la pagina delle risorse dei servizi vocali e, una volta aggiunta un'istanza al tuo account, gli avvisi di monitoraggio e l'utilizzo possono essere visualizzati in un'unica finestra.

Microsoft Azure Speech to Text: prestazioni

Nell'ambito della nostra revisione di Microsoft Azure Speech to Text, volevamo vedere come questa piattaforma ha gestito la sfida dell'elaborazione di registrazioni vocali non elaborate, quindi, una volta che il nostro account Azure era pronto, abbiamo caricato una serie di clip con diversi livelli di rumore di fondo . Su tutta la linea, Azure ha svolto un buon lavoro nell'elaborazione dei nostri campioni poiché non abbiamo visto più di una manciata di errori durante la nostra valutazione.

L'abilitazione del modello vocale personalizzato di Azure ha migliorato la nostra precisione di trascrizione.

All'inizio Azure ha avuto un po 'di difficoltà durante l'elaborazione di frasi insolite o speciali come nomi di squadre sportive e termini scientifici, ma questo è stato rapidamente risolto abilitando l'opzione di output del modello personalizzato. Dopo aver attivato questa opzione, Azure è stato in grado di adattarsi al vocabolario e allo stile di conversazione unici che abbiamo utilizzato.

Microsoft Azure Speech to Text: supporto

Per imparare a interagire con Azure Speech Services SDK attraverso diversi linguaggi di programmazione e integrare le funzioni di Azure Speech to Text nella tua piattaforma, avrai sicuramente bisogno di aiuto. Fortunatamente, Microsoft ha creato un catalogo completo di materiali di formazione per la piattaforma Azure, in cui troverai esempi di codice e suggerimenti pratici.

La sezione di formazione del sito di Azure contiene molte risorse utili.

Inoltre, tutti i clienti Azure ottengono supporto gratuito per la fatturazione e la gestione delle sottoscrizioni a cui è possibile accedere tramite un sistema di ticket. È possibile aggiungere un supporto più approfondito al tuo account a un costo ricorrente, a partire da $ 29 al mese.

Microsoft Azure Speech to Text: verdetto finale

La piattaforma Azure Speech to Text utilizza una tecnologia all'avanguardia per fornire un servizio di trascrizione quasi perfetto. È più adatto per le aziende che hanno già investito nell'ecosistema di Microsoft Office 365 perché i modelli vocali e di vocabolario personalizzati possono essere generati in modo sicuro dal tuo archivio di documenti esistente. Alcune piccole imprese potrebbero avere difficoltà con Azure poiché la configurazione corretta richiede l'attenzione di uno sviluppatore cloud Microsoft qualificato.

La competizione

Amazon Transcribe, Google Cloud Speech-to-Text e Watson Speech to Text sono concorrenti diretti di Microsoft Azure. Queste tre piattaforme sono inoltre tutte in grado di eseguire accuratamente trascrizioni batch di volumi elevati. Google Cloud è l'unico concorrente vicino in grado di lavorare con più lingue rispetto ad Azure, ma è più costoso, con una tariffa iniziale di soli $ 0,006 per 15 secondi, rispetto a $ 0,017 di Azure al minuto ($ 0,00425 per 15 secondi).

Per trovare altre alternative a Microsoft Azure Speech to Text, consulta la nostra migliore guida al software di sintesi vocale.

Articoli interessanti...