Recensione di Google Voice Typing

Sommario:

Anonim

Sta diventando sempre più comune usare la voce per controllare le nostre case e i computer. Dove solo un decennio fa chiedere ad Alexa o Google Home di controllare le luci o ordinare un prodotto da Internet poteva sembrare insolito, ma ora è la norma.

Una delle aziende che ha investito di più in questo tipo di tecnologia è Google, che consente ai propri dispositivi Google Home e ai sistemi Android di accettare comandi verbali e persino riconoscere chi parla.

Oggi esamineremo come hanno collegato questa tecnologia alla loro piattaforma di Google Documenti e valuteremo se questa è una valida alternativa ad altre soluzioni commerciali voice-to-text.

Prezzi

Il software è incluso in Google Docs e quindi è intrinsecamente gratuito. Tutto ciò di cui hai bisogno per usarlo è un account Google e un dispositivo mobile o un computer con un microfono. È un'altra fonte di dati che Google raccoglie, ma al giorno d'oggi fa parte del prezzo del "gratis".

Design

È possibile utilizzare la voce per l'input su Google Documenti, la funzione si chiama "Digitazione vocale" e può essere trovata nel menu Strumenti su un documento Google o all'interno di Presentazioni Google. Può anche essere attivato in entrambe le posizioni utilizzando il tasto di scelta rapida Ctrl-Shift-S.

Quando lo hai attivato per la prima volta, ti viene chiesto di autorizzare l'accesso al microfono per docs.google.com.

Dopo aver accettato che appaia una piccola casella con un logo del microfono su di essa, puoi fare clic per attivare l'input vocale. Questo viene quindi sostituito con un simbolo di microfono rosso accanto al documento per indicare che il sistema è in modalità di ascolto.

Prima di attivare la digitazione vocale nel pannello di controllo, puoi scegliere una lingua da un menu e, poiché questo è Google, ci sono molte scelte. Inoltre, puoi anche fare clic su un punto interrogativo e ricevere assistenza su come utilizzare il sistema.

Poiché questi sistemi funzionano, questa è una soluzione altamente condensata.

Google elaborerà ciò che dici al meglio delle sue capacità e se il sistema non è sicuro di una parola esattamente, la sottolineerà in grigio. Queste parole "sospette" possono quindi essere cliccate e alcune alternative fornite dal sistema.

Ma puoi spostarti rapidamente in un documento e risolvere i problemi manualmente o posizionare il cursore e dare a Voice Typing un'altra pugnalata.

Se hai bisogno di parlare con un'altra persona mentre lavori, puoi chiedere a Google di interrompere l'ascolto e riprendere in seguito.

Ma per ottenere la piena funzionalità di questa soluzione c'è un lungo elenco di comandi che devono essere memorizzati che possono copiare, incollare, spostarsi nel documento, inserire tabelle e una miriade di altre funzioni.

Inoltre, puoi inserire la punteggiatura, formattare il documento e persino inserire collegamenti ipertestuali.

Ma, per ottenere il massimo da esso, si presume che sia possibile ricordare i comandi o avere la guida aperta per migliorare la memoria.

Un elenco è rapidamente disponibile pronunciando comodamente "Elenco comandi vocali".

Le lingue

Laddove molte soluzioni da voce a testo coprono solo un numero limitato di lingue, Google ne ha una quantità significativa. L'attuale elenco definitivo è:

Afrikaans, amarico, arabo, arabo (Algeria), arabo (Bahrain), arabo (Egitto), arabo (Israele), arabo (Giordania), arabo (Kuwait), arabo (Libano), arabo (Marocco), arabo (Oman) , Arabo (Palestina), arabo (Qatar), arabo (Arabia Saudita), arabo (Tunisia), arabo (Emirati Arabi Uniti), armeno, azero, Bahasa Indonesia, basco, bengalese (Bangladesh), bengalese (India), bulgaro, Catalano, cinese (semplificato), cinese (tradizionale), cinese (Hong Kong), croato, ceco, danese, olandese, inglese (Australia), inglese (Canada), inglese (Ghana), inglese (India), inglese (Irlanda) , Inglese (Kenya), inglese (Nuova Zelanda), inglese (Nigeria), inglese (Filippine), inglese (Sud Africa), inglese (Tanzania), inglese (Regno Unito), inglese (Stati Uniti), farsi, filippino, finlandese, francese , Galiziano, Georgiano, Tedesco, Greco, Gujarati, Ebraico, Hindi, Ungherese, Islandese, Italiano, Italiano (Italia), Italiano (Svizzera), Giapponese, Giavanese, Kannada, Khmer, Coreano, Laotiano, Lettone, Lituano, Malayalam, Malesia n, marathi, nepalese, norvegese, polacco, portoghese (Brasile), portoghese (Portogallo), rumeno, russo, slovacco, sloveno, serbo, singalese, spagnolo, spagnolo (Argentina), spagnolo (Bolivia), spagnolo (Cile), spagnolo (Colombia), spagnolo (Costa Rica), spagnolo (Ecuador), spagnolo (El Salvador), spagnolo (Spagna), spagnolo (USA), spagnolo (Guatemala), spagnolo (Honduras), spagnolo (America Latina), spagnolo (Messico ), Spagnolo (Nicaragua), spagnolo (Panama), spagnolo (Paraguay), spagnolo (Perù), spagnolo (Porto Rico), spagnolo (Uruguay), spagnolo (Venezuela), sundanese, swahili (Kenya), swahili (Tanzania), Svedese, Tamil (India), Tamil (Malesia), Tamil (Singapore), Tamil (Sri Lanka), Thai, Turco, Ucraino, Urdu (India), Urdu (Pakistan), Vietnamita e Zulu.

Sono 119 lingue, comprese 13 forme arabe, 19 varianti spagnole, 13 dialetti inglesi e persino quattro tipi di tamil.

Sono incluse lingue che raramente sono supportate dal software di dettatura, come lo zulu e l'islandese, a causa del numero relativamente ridotto di parlanti.

La copertura linguistica è probabilmente il più grande punto di forza di Google Voice Typing.

Registrazioni

Se questa soluzione ha un punto debole, è che non può elaborare facilmente le registrazioni.

Anche se non è impossibile farlo, ma richiede di patchare il sistema audio del computer in modo che prenda l'output destinato agli altoparlanti e lo diriga come se provenisse dal microfono. Ma farlo non ti consente di distinguere tra persone diverse nelle registrazioni e potrebbe interferire con l'intelligenza artificiale che Google utilizza per migliorare l'accuratezza verbale imparando come parli.

Se desideri trascrivere podcast o interviste registrate, ti consigliamo di utilizzare qualcos'altro, poiché questo strumento non è stato creato per quello scopo.

Precisione

È difficile giudicare l'accuratezza di un sistema di elaborazione vocale quando non è possibile inviargli le stesse registrazioni convertite da altri prodotti. E chiunque utilizzi regolarmente Alexa o Google Home saprà che a volte non ci capirà, principalmente a causa di suoni estranei o di conversazioni incoerenti.

Detto questo, nel test attivo che abbiamo fatto, questo strumento generalmente ha ottenuto la maggior parte delle parole corrette, oppure la parola corretta è stata rapidamente disponibile nel menu delle parole sospette.

Per ottenere i migliori risultati è necessario un certo controllo da mostrare nella velocità, nel volume e nel tono del parlare, qualcosa che senza dubbio viene fornito con la pratica. Inoltre, essere in grado di ricordare tutti i comandi speciali può ridurre la quantità di modifiche post-registrazione necessarie, in modo critico.

A seconda delle tue aspettative, la precisione qui è accettabile. C'è una coerenza nelle sue interpretazioni che ha mantenuto durante i nostri test. Quanto bene funzioni per te, non possiamo prevederlo. Ma poiché è gratuito, non ti costerà altro che il tuo tempo per determinarlo.

Sicurezza

Poiché si tratta di Google, il modello di sicurezza è lo stesso che controlla l'accesso a tutti gli account Google. Ciò va dalla semplice protezione tramite password a una più ragionevole metodologia di autenticazione a due fattori (TFA).

Dato il numero di ladri di identità in giro, coloro che utilizzano Google senza TFA corrono un rischio significativo nel vedere i propri account compromessi.

Anche questa opzione di sicurezza ha i suoi limiti, ma è meglio di una semplice password.

Per coloro che non sono sufficientemente paranoici, ti consigliamo vivamente di andare su https://myactivity.google.com/myactivity

Inoltre, vedrai ciò che Google raccoglie quotidianamente su di te e ciò potrebbe includere le registrazioni dei tuoi comandi vocali.

Verdetto finale

Questa potrebbe essere una recensione più lunga se questo software offrisse più funzionalità, ma non lo è.

Per come funzionano le soluzioni voice-to-text, questa non è complicata, ma ha abbastanza funzionalità per essere veramente utile.

Altre soluzioni sono costruite per gestire la trascrizione di conversazioni tra più persone, dove questa è stata progettata per gestire una sola persona che sta parlando in modo controllato e preciso.

Ciò che si presuppone per utilizzarlo è che tu sia felice di utilizzare Google e Google Documenti, anche se questa non è la destinazione finale del testo che inserisci.

Non è un problema copiare un dettato incollato da Google Documenti in un'altra applicazione e avrai una copia cloud a cui fare riferimento se dovessi averne bisogno.

Alcuni utenti hanno comprensibilmente problemi ad alimentare l'insaziabile appetito di Google per i dati degli utenti e questo meccanismo è un'altra fonte di dati da utilizzare.

Se ti senti così, non utilizzerai Google Voice Typing o qualsiasi altra cosa di Google.

Per coloro che sono disposti ad accettare quanto Google potrebbe sapere su di loro, la soluzione di dettatura vocale in Google Docs è sufficiente per un uso generale, soprattutto se hai bisogno di questa funzionalità solo occasionalmente.