Recensione del software di trascrizione Sonix.ai

Ogni strumento che trascrive si rivolge a una nicchia specifica e Sonix ha scelto quelli che registrano riunioni o presentazioni e quindi necessitano di una versione digitata per la ricerca o la diffusione.

Pertanto, potrebbe essere altrettanto utile per uno studente come potrebbe esserlo per un dirigente, fornendo trascrizioni che possono essere facilmente indicizzate per riferimento futuro.

Ma per avere successo in queste attività, il software deve essere accurato e conveniente.
Sonix.ai è quello strumento e un servizio online può competere con un'applicazione installata?

  • Vuoi provare Sonix.ai? Controlla il sito web qui

Piani e prezzi

Come per molti servizi di trascrizione, il modello di costo di Sonix è basato sul tempo. In particolare, la durata di qualsiasi registrazione che carichi sul servizio per l'elaborazione e il costo di quella risorsa è di $ 10 l'ora se utilizzi il servizio standard pay-as-you-go.

Il costo orario può essere ridotto a $ 5 se ti iscrivi al servizio di abbonamento Premium per $ 22 al mese per ogni utente. Inoltre, sono disponibili sconti sul volume per quelle aziende che richiedono più di 100 ore al mese di trascrizione.

Il piano Standard ha le funzionalità più basilari e Premium ne aggiunge altre come l'accesso multiutente e la condivisione del team. Inoltre, Enterprise ha tutto ciò che Premium offre con molti extra per l'amministrazione e un modello di supporto migliorato.

Con il passare dei servizi di trascrizione, Sonix è uno dei più costosi e certamente non qualcosa che la maggior parte degli studenti o degli utenti domestici potrebbe ragionevolmente permettersi.

Design

Il sito my.sonix.ai utilizza un design eccezionalmente pulito e creare un account è gratuito.

Al momento della scrittura, questo è esclusivamente un servizio basato sul Web e Sonix non dispone di un'app mobile per acquisire e inviare all'elaborazione delle registrazioni audio.

Tuttavia, come tratteremo più tardi, ci sono semplici modi per aggirare questo problema che risolvono in qualche modo la mancanza di un'app mobile.

Il punto di partenza per qualsiasi lavoro di trascrizione è la dashboard di Sonix.ai, dove puoi vedere l'audio che è già stato trascritto e aggiungerne di nuovi da elaborare.

Poiché questo sistema è stato progettato per più utenti, include un sistema di cartelle virtuali per organizzare le trascrizioni in qualsiasi modo ritenuto opportuno.

Facendo clic su "carica" ​​l'utente viene indirizzato a una pagina in cui è possibile inserire più file nel sistema e, se l'account dispone di credito sufficiente, è possibile elaborarli.

Sono supportati tutti i formati di file audio standard inclusi wav, mp3, mp4a, aiff, acc, ogg e wma, e puoi anche caricare alcune strutture di packaging video. La dimensione massima del file è di 4 GB, quindi prima di caricare un file video con risoluzione 4K di grandi dimensioni, ti consigliamo di utilizzare qualche altro strumento per dividere l'audio in modo da velocizzare il caricamento.

Un buon modo per velocizzare il caricamento è utilizzare una struttura di archiviazione cloud come Google Drive, One Drive, Box o Dropbox e collegarla direttamente all'account. Puoi anche inviare un'e-mail al sistema utilizzando Gmail, come mezzo per creare un flusso di lavoro più elegante rispetto al rilascio di file su una pagina web.

Questa automazione viene fornita tramite Zapier, consentendo un'integrazione molto più ampia se l'azienda che la utilizza ha investito in quella tecnologia per connettere i propri processi aziendali.

Un altro bel tocco è che insieme al file audio o video, puoi includere la trascrizione esistente, come mezzo per completare più rapidamente il processo e migliorare la precisione.

Un altro bel tocco è che insieme al file audio o video, puoi includere la trascrizione esistente, come mezzo per completare più rapidamente il processo e migliorare la precisione.

A causa della natura dell'elaborazione basata su cloud, giudicare quanto sia veloce o lenta l'elaborazione potrebbe essere impossibile, ma Sonix.ai è relativamente veloce nella nostra esperienza. In genere è necessario tra il 10% e il 20% del tempo per la trascrizione man mano che la registrazione dura. Pertanto, il completamento di una registrazione di 10 minuti richiede solitamente meno di 2 minuti.

Non è necessario seguire l'elaborazione, in quanto il sistema ti invierà una notifica via e-mail quando il lavoro sarà terminato, insieme a un link alla nuova trascrizione.

Una volta elaborato il file, puoi aprirlo all'interno e modificare la pagina per rivedere i risultati, ed esportare il testo in un'ampia gamma di formati utili, inclusi quelli definiti come sottotitoli da alcune app.

Il numero di lingue e dialetti supportati dal sistema è 36 e include più paesi di lingua inglese, francese, cantonese, mandarino, portoghese e spagnolo, oltre a tutte le lingue comuni dell'Europa occidentale e orientale, insieme ad alcune lingue asiatiche e arabe.

Registrazioni

Oltre al lavoro svolto nell'intelligenza artificiale necessaria per interpretare i rumori che gli umani fanno, probabilmente la pagina delle registrazioni rappresenta uno sforzo di codifica significativo qui.

Qui sia l'audio che la trascrizione associata possono essere confrontati e migliorati manualmente con i dettagli delle modifiche degli altoparlanti e correzioni di interpretazioni errate.

Per chiunque stia lavorando su una trascrizione per rifinire il testo, questa pagina fornisce la posizione della superficie. È logico che sia stato fatto uno sforzo in questa parte, poiché è molto facile da usare e da seguire.

Nel tentativo di indirizzare l'utente su dove potrebbero esserci problemi, Sonix.ai colorerà il contenuto per evidenziare quelle sezioni che è meno sicuro. Questa funzione può essere utile, sebbene Sonix.ai possa commettere errori anche in quelle parti in cui ritiene che la trascrizione abbia uno stato "Molto sicuro".

Gli aspetti migliori di questa pagina sono il modo in cui la riproduzione audio e il testo vengono sincronizzati in modo che posizionando il cursore nel testo si sposta la posizione di riproduzione nella stessa sezione.

Oltre alla semplice modifica, è anche possibile evidenziare sezioni in vari stili e prendere appunti per accompagnare la trascrizione.

Puoi anche modificare il codice di tempo, particolarmente utile se la registrazione inizia con una lunga pausa o un preambolo indesiderato.

Precisione

Sonix descrive Sonix.ai come "Il miglior software di trascrizione automatizzata basato su un'intelligenza artificiale all'avanguardia".

Dati i nostri test, descriveremmo questo prodotto come fortemente dipendente dalla qualità della registrazione e da molti altri fattori che non possono essere facilmente controllati.

Durante l'elaborazione delle nostre classiche registrazioni di discorsi storici, è stato davvero difficile con alcuni altoparlanti, anche se ci sembravano chiari.

Questi risultati erano in netto contrasto con alcune registrazioni più simultanee, in cui l'accuratezza era accettabile ma difficilmente stellare.

Abbiamo concluso che l'approccio adottato da Sonix fa diversi presupposti che possono funzionare o meno, a seconda dell'oratore e della qualità della registrazione.

Ciò che è stato affascinante è che il servizio colorerà la sua trascrizione in base a quanto è sicuro di ciò che viene detto, e questa autoanalisi è molto rivelatrice.

In alcune circostanze, identificherà correttamente che una sezione potrebbe essere sospetta, ma in altre parti è sicuro che la sezione sia stata trascritta completamente in modo errato.

Alcuni problemi comuni sembrano farla impazzire, e una di queste sono le persone che non parlano una prosa grammaticalmente perfetta. Nel tentativo di rendere il loro discorso più diretto, hanno rimosso alcune parole dalle loro frasi, creando uno stile più drammatico. Quando questi vengono trascritti da Sonix, sembra determinato ad aggiungere nuovamente quelle parole per adattarle al suo modello grammaticale interno, piuttosto che a ciò che è stato effettivamente pronunciato.

La trascrizione si legge meglio come documento, ma non è veramente rappresentativa di ciò che è stato detto.

Sonix è sicuramente migliore quando la qualità della registrazione e la chiarezza dell'altoparlante sono elevate, come abbiamo dimostrato con una piccola clip di Stephen Fry che legge Harry Potter. Ma non è possibile avere sempre un tale controllo sulla qualità del suono, e ha comunque commesso degli errori con quel test.

Un'altra area problematica sono i nomi formali e le parole tecniche o le abbreviazioni. Questi possono essere risolti aggiungendoli al dizionario personalizzato, ma questo richiede un lavoro per rendere il sistema in grado di rendersi conto meglio quando vengono utilizzati nomi o acronimi.

Per coloro che necessitano di una parola di trascrizione perfetta, Sonix ha una selezione di trascrittori professionisti associati che possono lavorare su una registrazione e affrontare tali problemi, ma questo vanifica in qualche modo lo scopo della trascrizione elaborata.

Sicurezza

Il fulcro della sicurezza di Sonix.ai sono i server in cui viene elaborato l'audio e vengono conservate le trascrizioni.

Tutto il traffico viene crittografato utilizzando TLS (Transport Layer Security) e una volta che i file si trovano sul server protetto da più livelli di firewall, la protezione dalle intrusioni e tutti i dati sono protetti dalla crittografia lato server AES-256. Inoltre, l'azienda promette che i dipendenti non hanno accesso a registrazioni o trascrizioni a meno che non venga loro dato il permesso esplicito di averlo.

Il problema critico con questo approccio è che un semplice login e password possono aggirare tutto. Sonix.ai non ha l'autenticazione a due fattori e non ha un registro facilmente accessibile di chi accede ai file e quando.

Dal punto di vista della sicurezza, questo potrebbe essere considerato un eccessivo affidamento sull'integrità di coloro che utilizzano il sistema per non condividere le registrazioni con altri al di fuori dell'azienda o conservare i file potenzialmente sensibili quando lasciano l'azienda.

In breve, la sicurezza deve essere migliore e al monitoraggio o all'attività degli utenti viene data maggiore priorità.

Verdetto finale

Considerando il costo relativamente alto, ci aspettavamo che Sonix avrebbe funzionato meglio di quanto avesse fatto.

Forse siamo stati sfortunati con le nostre scelte di cose da transcodificare, ma sembrava ancora fare una quantità eccessiva di errori.

Il lato positivo di questa equazione è che è veloce ed è un sistema straordinariamente facile da usare, anche se consigliamo di eseguire alcune registrazioni di esempio tramite questa soluzione prima di sottoscrivere un abbonamento.

Il problema più grande con Sonix è il costo elevato e, anche se è lo strumento giusto per le tue esigenze particolari, ci sono mezzi più economici per trasformare l'audio in testo altrove.

Articoli interessanti...