Microsoft: nuovo record di precisione nel riconoscimento vocale

21 Agosto 2017 56

Microsoft conferma oggi di aver raggiunto un nuovo importante traguardo nel percorso di potenziamento della tecnologia per il riconoscimento vocale conversazionale - ovvero quello che prevede un'interazione uomo-macchina che segue le dinamiche tipiche del dialogo tra esseri umani. La percentuale di errore scende dal 5,9 per cento, raggiunto lo scorso anno da un gruppo di ricercatori della divisione Microsoft Artificial Intelligence e Research, al 5,1 per cento. Si tratta, sostanzialmente, dello stesso margine di errore a cui va incontro un trascrittore professionale in carne ed ossa.

Per mettere alla prova la tecnologia suddetta, viene utilizzata una raccolta di 2400 conversazioni telefoniche (Switchboard Corpus), impiegata per tali scopi anche da altri studiosi sin dagli inizi degli anni '90. Il nuovo studio è stato condotto dai ricercatori del gruppo Microsoft AI e Research con l'obiettivo di raggiungere lo stesso livello di precisione di un gruppo di trascrittori umani che hanno la possibilità di riascoltare più volte la conversazione, interpretarla utilizzando informazioni contestuali e collaborare con altri trascrittori.

Il tasso di errore è stato quindi ridotto del 12 per cento nel corso di 12 mesi. Per raggiungere lo scopo, i ricercatori hanno tra l'altro consentito agli algoritmi di riconoscimento vocale di utilizzare l'intera conversazione, per adattare la trascrizione al contesto - esattamente come fa un essere umano - e prevedere in anticipo le parole o le frasi successive. Si ricorda che il sistema di riconoscimento vocale di Microsoft viene utilizzato in una molteplicità di servizi, a partire da Cortana.


56

Commenti

Regolamento Commentando dichiaro di aver letto il regolamento e di essere a conoscenza delle informazioni e norme che regolano le discussioni sul sito. Clicca per info.
Caricamento in corso. Per commentare attendere...
Rick Deckard®

Va beh quello è un altro discorso..

MatitaNera

naaa... se poi ci mettiamo che da qualche anno mi è venuta la fissa delle edizioni d'epoca su ebay...

Rick Deckard®

Sì è vero ma ormai ci sono gli ebook. Lì leggi senza accendere luci, risparmi carta e spazio..
Poi lo so che va a gusti ma i vantaggi ci sono

MatitaNera

io ho fatto una selezione, negli anni alcuni le ho decisamente ridimensionati come valore, e ne ho donato centinaia alla biblioteca, ne tengo in casa un numero fisso pari a mille circa... se ci pensi, i libri che vale la pena rileggere, non sono poi moltissimi...

Rick Deckard®

Eh sì.. però quando ne hai una libreria piena , scatoloni in cantina, dai tuoi e nessuno spazio per aggiungerne altri ringrazierei che esistono gli ebook

MatitaNera

cosa ? cartaceo o ebook ? io sono un lettore forte e ci ho provato, ho letto parecchio su ebook, ma sono tornato indietro, mi piace il libro anche come oggetto

Rick Deckard®

A casa mia si.

Rick Deckard®

Ma infatti va benissimo per frasi brevi e poco complicate

Rick Deckard®

Cortana è peggio... Stesso microfono

Rick Deckard®

Devi corteggiare la dirigenza di onedrive è andare fino in fondo..

Scherzi a parte lo spazio gratuito l'hanno ridotto un paio di anni fa tagliando anche tutti i bonus. Mi sa che quadagni qualcosa invitando amici

Rick Deckard®

Mah.. tutte le volte che lo provano i colleghi Cortana non capisce nulla... Forse sono rumori di fondo ed altre cose a confonderli

X Wave

Si è in inglese. Sono 12 anni che abito qui, l'accento c'entra è vero ma relativamente, se prendi uno di Glasgow è forte come quello d'un italiano se non di più

lollos60

Cortana per Xbox è disponibile in alcune aree geografiche e in lingue selezionate (non figura l'italiano). Probabilmente avrai scelto come lingua di sistema l'inglese vero?

X Wave

Scrivo da UK, forse in alcuni paesi non e' disponibile. Cmq non ti perdi niente...e' talmente lento e impreciso che finisci per non usarlo neanche.

Mario

Salve a tutti ragazzi, scusate il mio OT, vorrei sapere se qualcuno ha da darmi un codice promozionale per aumentare lo spazio su OneDrive o in alternativa conosce un metodo per farlo, ovviamente senza sottoscrivere alcun Abbonamento, si accettano tutte le soluzioni Free Grazie Mille

Diciamo che siamo in pochi a sapere cosa gli stiamo dando.
Il problema é che questi americani (che sia Google o Microsoft) fanno di tutto per poter prelevare i dati e fornirli poi allo stato.
E quando una ditta come Nokia arriva a darti un OS non americano, una qualche ditta americana farà di tutto per distruggerti e acquisirti con metodi poco ortodossi.

Ma non sono solo loro... E' colpa nostra se crediamo a tutte le fesserie che ci raccontano. E' la nostra ign0ranza che gli permette di manomettere le notizie affinché noi polli ci crediamo.

000

l'ho già detto google è bravo perché conosce anche quanti peli abbiamo nel naso con le info che gli diamo senza neanche accorgercene...

000

mi dispiace ma non sono per niente d'accordo...

000

guarda l'attenzione con cui rispndo a queste discussioni è bassa comunque, co la dettatura la cosa importante è aver chiaro cosa dire prima di cominciare, la frase esce fluida e poi un paio di errori li sistemo dopo... invece scrivendo con la tastiera ci metto molto di più e il risultato, visto il poco tempo che ci dedico è comunque pessimo a livello di italiano...

000

io uso spesso cortana anche sul pc, è più comoda di quanto non credi...basta cominciare un po' a provarci e ti rendi conto che intanto che le fa qualcosa tu ne fai un'altra, ad esempio la uso per lanciare programmi prima di finir di leggere una pagina web

Aikon

In Italia sicuramente si (anche se non è male per niente) in America è ben diverso.

X Wave

Uso il Microfono di Kinect e fa schifo stesso. Dal modo infantile di approcciarti, mi sa che il microfono Chicco te le mettono ancora in camera mentre dormi

Simone

Capisce più della media degli esseri umani (5.8-9) lui ora è a 5.1

Maltob

Perché a te è disponibile? a me su Xbox one s dice che non è disponibile nel mio paese

O_Marzo

Lo potevi dire da subito che non eri serio!

Simone

Per la velocità ci vorrà un po' di tempo...
Se usi il microfono della Chicco anche un essere umano in carne ed ossa non capirebbe nulla

LaVeraVerità

La tua risposta non fa che confermare ciò che ho detto, ovvero che in molti si esprimono in italiano con l'accetta. Avresti potuto curare maggiormente la correttezza di ciò che hai scritto e se sei stato così impreciso pur agevolato dai tempi di una tastiera, figuriamoci a voce.

Io ad esempio l'avrei scritto così:

Cosa assolutamente falsa, è solo questione di abitudine.
Come scrivi solamente quando sei sicuro di una cosa, (ti abitueresti) ci si abituerebbe a dettare allo stesso modo.
Poi(, )una volta dettato, si può anche ovviamente correggere (con la)a tastiera(, ma)
Ma non c(')entra niente quello che (hai detto:)hai detto tu: è solo questione di abitudine.

MatitaNera

e io che ho detto ?

C#Dev

Ma che c'entra??

Si sta parlando di metodi di input, non che uno è meglio di un altro ma che è solo questione di abitudini.

X Wave

Sarà anche.....Cortana della X Box non capisce niente ed è lenta come una lumaca

MatitaNera

ma considerando che il mobile MS non esiste, che su Android non credo siano in molti a sostituirla a quello nativo, che sul desktop (parere personale) non serve a nulla e in ogni caso viene usato da una nicchia di nerd... voglio dire, che fine farà ?

MatitaNera

non necessariamente il nuovo è meglio, anche gli ebook dovevano annientare i libri cartacei ma al momento così non è successo...

Passante

Se nessuno userà cortana, no. Altrimenti sì. Già di siri si sa che non capisce una mazza.

MatitaNera

parlo della gente comune, non noi esperti

O_Marzo

Tu sicuramente

CapitanoFindus

Si, è vero che per registrare un messaggio fai più di qualche tentativo.
Ma è altrettanto vero che lo si fa anche con la scrittura.
Poi si, di solito si riflette di più prima di scrivere, si organizzano meglio i concetti, ma alla fine si fa esattamente la stessa cosa, quindi ci vedo una differenza così marcata....

Non esiste scrittore, filosofo, letterato o scienziato che non scriva e riscriva la stessa frase più volte.
Poi c'è anche qualcuno che scrive "al primo colpo", ma nel 99,99% dei casi parliamo di scrittura di pessima qualità.

Massi91

guarda io gli appunti li scrivevo con un dragon naturally (qualcosa) che scriveva quello che dicevo, ovvio che se sai che stai dettando qualcosa fai meno pause.

C#Dev

Cosa assolutamente falsa.

È solo questione di abitudine.

Come scrivi solamente quando sei sicuro di una cosa, ci si abituerebbe a dettare allo stesso modo.

Poi una volta dettato, si può anche ovviamente correggere a tastiera.

Ma non centra niente quello che hai detto tu: è solo questione di abitudine.

Midnight

Dato che sono appena un po' sordo direi che ormai Cortana capisce più di me...

acitre

Portare avanti la tecnologia del riconoscimento vocale non serve solo per fare quelle 4 scemenze col cellulare oggi. In prospettiva futura avrà un utilità enorme. Dall'interazione profonda uomo macchina alla traduzione in tempo reale di infinite lingue (Skype già fa qualcosina). Non pensate sempre e solo in ottica oggi è domani. Certi investimenti si fanno per trovarsi avanti anche tra 5 o 10 anni. Vedi anche hololens.

MatitaNera

resta il fatto che lo usano in pochi su pc al momento, qualunque cosa sia

MatitaNera

scomettiamo che nessuno si accorgerà di questa "qualità" ?

LaVeraVerità

Trascuri quello che è l'aspetto umano della applicazione della tecnologia.
Hai mai provato a dettare un testo ad un registratore, ad esempio una segreteria telefonica? La cosa che capita più comunemente è quella di impappinarsi, aggiungere pause a sproposito, prolungare le vocali, inserire intercalari tipo ehhh, mmhhh, oohhh, ecc...
Il risultato è quello che spesso è necessario registrare di varie volte lo stesso messaggio.

Non dico che non sia utile su pc ma normalmente la parola scritta (tramite tastiera) ha dalla sua proprio il tempo necessario per esprimerla, che consente una adeguata riflessione su grammatica e contenuti, rispetto alla maggiore povertà della lingua espressa a voce.
Questa mia stessa risposta al tuo post è stata soggetta a diverse revisioni prima di essere inviata (cosa che in molti dovrebbero fare) e non mi risulta che i sistemi di input vocale siano dotati della flessibilità e rapidità di editing che ciò richiede.

Penso che si riferisse a Bing come motore di ricerca...

Jeson Turner

Vogliono puntare sulla qualità. Avendo perso il mobile non è una cattiva idea

Peccato che Cortana sia molto di più di un semplice riconoscimento vocale.

lars_rosenberg

A me sembra che Cortana capisca meglio del Google Assistant. Ormai funzionano molto bene entrambi comunque.

J.H. Bolivar Pacheco

Il fatto che tu non lo utilizzi nel pc non significa che altri non lo utilizzino.
Probabilmente è una tecnologia che deve prendere ancora piede, ma non credere che lo utilizzino in pochi.

Il comando "ehi cortana" (ovviamente da attivare) l'ho insegnato anche a mia madre che col pc riesce a domandare meteo , aprire mail o impostare sveglie. Cose semplici , ma alla fine da qualche parte bisogna pure iniziare ad imparare.

Damiano

Non è del tutto vero, io ho un Lumia 650, e grazie alla possibilità di impostare Cortana come assistente vocale dell'auto (Toyota Verso 2014), riesco a gestire messaggi, chiamate, promemoria, Internet e musica, tutto dall'auto, lo usa anche mio papà che ha 8.1.
Sarebbe bello che nel giro di qualche anno sia sviluppata come nella pubblicità di Cortana e Volvo in partnership. Parlando di Pc, su questo ci sono delle funzioni in più rispetto al telefono, più utile di tutte secondo me il comando "Hei Cortana" da qualsiasi schermata

C#Dev

Eh sì!

Infatti un riconoscimento vocale così preciso farebbe proprio schifo per sostituire la scrittura su tastiera nella redazione di lunghi documenti!

Come si vede subito quando umo ha necessità di certe cose per lavorare e chi ne ha per giochicchiare...

HDblog @ Computex 2018: live blog continuo dalla fiera

Tutte le novità di Windows 10 1803 "April 2018 Update"

Guida Acquisto: i migliori Notebook, Ultrabook e 2-in-1 | #NATALE 2017

Windows 10 1709 Fall Creators Update disponibile: tutte le novità