L’assistenza vocale nel futuro sarà sicuramente sempre più parte del nostro quotidiano. E gli assistenti vocali saranno sempre più usati. Sono ancora in molti gli scettici a riguardo, sebbene qualcuno si sta ricredendo e altri stanno correndo ai ripari occupandosi dell’argomento.
Io mi sono fatto l’idea che questa tecnologia sarà sempre più presente nell’immediato futuro perché basta osservare i movimenti delle aziende che sviluppano questa tecnologia e come le persone stanno reagendo (o comunque reagiscono) nei confronti della tecnologia.
Assistenza vocale nel futuro, nessun entusiasmo
Io spero sempre che il messaggio passi correttamente. Io non dico (e non ho mai detto) che saranno abbandonati del tutto gli schermi e si navigherà solo tramite assistenza vocale.
Quando pensiamo agli assistenti vocali, gli smart speaker, sono la punta più avanzata della tecnologia. E sebbene negli Stati Uniti la diffusione sia abbastanza vasta, nel mondo, questa diffusione potrebbe essere più limitata. Per ragioni, a mio parere, culturali.
Ma la vera rivoluzione è la capacità che i nostri dispositivi, quali smartphone, portatili e personal computer, i dispositivi del nostro quotidiano, stanno acquistando. Ossia quella di essere controllati dalla voce. Già su questo sta lavorando Microsoft con la sua assistente vocale, Cortana; già Google al suo stato embrionale, con l’ultima versione di Google Chrome, permette di effettuare ricerche vocali evitando la tastiera.
Una interazione con una interfaccia grafica esisterà ancora per molto tempo. E chi ha imparato, magari in ritardo, ad usare uno schermo, non è detto che imparerà a farne a meno.
Un grande fratello fatto da sensori
Quando mi trovo con qualche amico o conoscente che vuole capire di cosa mi occupo spiego che mi occupo di progettazione chatbot e studio gli assistenza vocale. E subito il mio interlocutore inizia a immaginare il mondo possibile. Tendenzialmente distopico e fatto di tanto immaginario cinematografico.
Mi rendo conto che le opinioni di queste persone sono indirizzate molto dalle paure indotte dai giornali. Qualcuno di più attento, volge la sua attenzione al costo dei sensori, altri puntano alla possibilità di essere ascoltato. E questi, per esempio, sostengono che l’essere umano reagirà a questa dose di controllo, respingendo la tecnologia.
Personalmente non ho la palla di vetro per prevedere il futuro. Anche se mi pare difficile il ritorno ad una età pre-tecnologica, visto che ci si può difendere dalla tecnologia con altra tecnologia. Però so per certo che i sensori costano sempre meno. Aziende come Xiaomi stanno sbarcando nel mercato occidentale e hanno tutte le intenzioni per affermarsi anche con questi prodotti.
Smart speaker negli Stati Uniti
Gli utenti di Smart Speaker crescono del 48% ogni anno e negli Stati Uniti, quest’anno, hanno raggiunto il numero di 90 milioni.
Si tratta di una crescita esplosiva rispetto a qualsiasi altro prodotto tecnologico, come lo smartphone o rispetto al trend delle tecnologie indossabili.
In Italia, purtroppo, è sempre difficile avere analisi di questo genere. Ma basta guardarsi intorno, tra i propri amici. Io vedo confermato il trend nella mia bolla informativa. Così come ho iniziato a vedere amici e conoscenti che iniziano ad acquistare i primi sensori, un po’ per gioco e un po’ per vantarsi.
Sensori di sicurezza
Quanto costa un impianto di sicurezza? In quanti possono permetterselo? Non lo so. Fatto sta che su Youtube aumentano i tutorial che invitano a trasformare una semplice webcam o il vecchio smaryphone in una telecamera di sorveglianza per controllare casa quando non si è presenti.
Si tratta e si tratterà di una nicchia, come sempre, ma una nicchia sempre più avanzata e sempre più a basso costo.
Un tempo per essere degli innovatori si dovevano spendere interi stipendi. Oggi, con poche decine di euro compri un interruttore o una lampada a controllo vocale.
Assistenza vocale e User experience
L’user experience frena l’assistenza vocale. L’ho scritto. In parte è vero e in parte no. E molti miei colleghi restano scettici. È pure vero che nessuno di noi mai si occuperà di progettare uno smart speaker, ma presto ci chiederanno di progettare i servizi e dunque di progettare chatbot.
In Italia, ma neanche in Europa, difficilmente avremo un’azienda che sviluppa un prodotto come uno smart speaker con un assistente proprietario. Ma personalmente mi sento in dovere di essere un buon amico dell’assistenza vocale e occuparmi di architettura dell’informazione conversazionale.
Se mai qualcuno avrà un dubbio in più o in meno rispetto alla tecnologia grazie a questo blog, io avrò raggiunto il mio obiettivo. E siccome sono convinto che questa tecnologia prenderà sempre più piede, sono qui ogni lunedì ad osservare cosa accade.
Noi non siamo l’utente medio
Anche in questo caso, o forse, più che in altri casi, dobbiamo tenere in mente che
noi non siamo l’utente medio.
Non posso dire che siccome io non faccio uso di uno strumento questo strumento non avrà successo. Non posso affermare che i miei dubbi sono e saranno i dubbi delle masse.
Prendiamo, per esempio, i problemi della privacy che giornali e giornalisti mettono sempre in primo piano. E che la stessa Unione Europea ha evidenziato con l’adeguamento al GDPR. Quanti, oggi, pongono attenzione alla propria privacy? A me pare che si tratti di una minoranza. Io personalmente non faccio dirette facebook. Ma quando ci troviamo nel bel mezzo di una manifestazione tutto intorno si accendono telefonini che trasmettono in diretta l’evento indicando a tutta la cerchia di amici di Facebook ( o gli sconosciuti di Instagram), dove si trovano e con chi si trovano. Svelando posizione, parole ed emozioni anche di chi sta accanto.
Foto di bambini e minorenni, di mamme incinte, di famiglie intere diffuse e condivise sono state sdoganate anche dalle mamme più attente.
Questo cosa ci dice? Ci dice che il concetto di privacy è stato ampiamente superato dalle persone. Le persone raccontano dove sono, cosa fanno, in tempo reale; indicano esattamente i luoghi dove si trovano, le loro abitudini. Per non parlare poi delle numerose app per chi è in cerca di relazioni.
Le app di geolocalizzazione sono sempre più insistenti. Le nostre case sempre più invisibili. E i nostri smartphone ci spingono a farci geolocalizzare sempre più frequentemente. La paura di telecamere sparse per la città sono solo un vecchio ricordo. Anzi, in nome della sicurezza, sempre più cittadini ne fanno richiesta in ogni dove.
Quante scope hai in casa?
Ad agosto 2018, l’associazione Ritrovarsi, ha organizzato un festival di arte contemporanea per la riqualificazione di un quartiere di Sciacca, in provincia di Agrigento. Il quartiere San Leonardo. Si tratta di un quartiere bellissimo, perché si tratta del centro storico, a struttura araba e con forti elementi della cultura ebraica. Il quartiere, oggi, è abitato da gente che economicamente è messa male. Molti disoccupati, molti piccoli delinquenti, diseredati di ogni tipo, persone con handicap vari. Molte case sono chiuse e abbandonate, alcune quasi diroccate.
Non a caso la scelta di riqualificare quello che è diventato un luogo sospeso. Ebbene, ad un certo punto, volendo spazzare un po’ di cartacce sparse per i vicoli, abbiamo chiesto una scopa e una paletta agli abitanti che ci stavano dando una mano. Ebbene, abbiamo avuto difficoltà a trovare una scopa. Per intenderci, manico di legno e spazzola. La risposta che abbiamo ricevuto è stata che quasi tutti avevano e posseggono una scopa elettrica. Per fortuna, alla fine, abbiamo trovato una famiglia faceva e fa uso di scopa e paletta, che ci ha gentilmente prestato.
Eppure scommetto che chi mi sta leggendo (se sei arrivato fin qui) ha più di una scopa per spazzare casa. E forse la scopa elettrica l’ha sempre desiderata ma non se l’è mai comprata.
Io, per esempio, in casa ne ho 4 di scope! Una per il terrazzo, due per la casa, una per la strada.
Una nicchia o una parte della popolazione
A mio parere ci sono fette di popolazione che saranno investite da questa tecnologia e ne faranno un uso massiccio.
La prima è sicuramente la nicchia dei curiosi degli intellettuali, quelli che compreranno gli smart speaker per provarli, per poterne parlare, e averne consapevolezza. Come hanno fatto Giorgio Robino e la sua compagna Giuditta Del Buono. (leggete il suo commento alla fine dell’articolo). Così come ci sarà la nicchia dei curiosi. Tanto più che, come dicevo poc’anzi, un tempo per essere innovativo dovevi spendere un botto di soldi, oggi basta davvero poco. Il solo limite è la curiosità.
Poi ci sarà una parte della popolazione benestante che lo comprerà per dire che lo ha comprato. Per mostrarsi e mostrare l’assistenza vocale agli amici, ai propri pari, che non saranno più pari. Lo farà perché può permettersi lussuriosamente di riempire di sensori la casa. Così come ha fatto Mark Zuckerberg.
Così come ci sarà chi non può permettersi di avere questa tecnologia in casa, ma avrà voglia di paragonarsi a chi sta davvero in alto. E acquisterà l’assistenza vocale a qualunque costo.
L’assistenza vocale oltre internet
In questo blog ho parlato di Google Duplex. E a parte le paure che si sono volute divulgare non ho trovato articoli che ne abbiano parlato in modo obiettivo.
Il fatto che l’assistente risponda al telefono significa che può fare anche a meno della rete internet. Questo significa che una moltitudine di persone oggi fuori dai giochi della rete, saranno riammessi dagli assistenti vocali. Allora il problema non sarà più se avere paura o meno della tecnologia, il problema, torno a dire, è di natura Etica.
Ossia, in parole sempre più chiare, quali risposte saranno date alle persone? Come saranno accolte da chi non ha nessun filtro a questa tecnologia?
Librerie contro televisori
Ebbene si, perché sarà proprio chi, in teoria, non può permettersi questa tecnologia a divulgarla sempre più. Saranno le persone, disoccupate, senza un mestiere, senza arte né parte.
Sono queste fasce di popolazione che hanno in casa lo Smart TV 70 pollici 4K. Queste famiglie non hanno pareti piene di librerie. Non acquistano libri o kindle, ma acquistano smartphone e tablet come se non ci fosse un domani.
Acquistano scope elettriche, non scope con cui ripulire economicamente la propria casa.
Assistenza vocale nel futuro, conclusioni
Ora quello che dico è questo. Siccome la diffusione di questa tecnologia, al momento, pare inarrestabile, non è bene per tutti parlarne e divulgare consapevolezza? Io ne sono pienamente convinto. E sono qui.
Forse, tra i miei lettori, ma anche tra i miei colleghi, c’è chi pensa che non dovrei essere io a occuparmene in quanto architetto dell’informazione. In quanto tale dovrei parlare di etichette e tag. Tra l’altro penso di farlo pure. O forse fraintendo io, ho capito male qualcosa. Ci sta anche. Se proseguo nel mio percorso è perché è stata l’architettura dell’informazione a darmi gli strumenti per giungere fin qui. E sono anche disposto ad uscire dal seminato ed aprire il dibattito. Se necessario.
Concludo qui dicendo che, certamente, ci sarà chi non userà mai i chatbot, gli assistenti vocali e continuerà ad entrare nei siti web tramite tastiera e grafica. Premerà pulsanti e clicckerà vita natural durante, come se nel mondo non accadesse nulla.
Ma ci sarà una parte che parlerà con gli strumenti. Forse non sarà la parte più istruita, forse sarà la parte più negletta. Molto probabilmente ancora sarà la parte esclusa, fino ad oggi, dall’internet come dimostra il rivoluzionario servizio di telefonia My Line.
Gli altri ne resteranno fuori? Quando i servizi parlanti saranno obbligatori? Sarà ancora così?
Insomma, il dibattito è aperto, così come (secondo me) la strada dell’assistenza vocale nel futuro.
L’immagine in evidenza è un opera d’arte esposta durante il festival di arte contemporanea Ritrovarsi 2018. Si tratta dell’opera “Rebus (7,1,4,1,5,1, 6)” di Zoo che su Instagram si definiscono: “Trois femmes ensemble” ci muoviamo all’interno di uno spazio che ci viene proposto, col dialogo troviamo punti in comune che diventano l’opera stessa.
Assistenza vocale: perché adesso?
da Toni Fontana | Mag 23, 2016
L’assistenza vocale adesso è l’argomento del momento, come fosse una moda e, in effetti, per molti, è considerata tale. Nelle scorse settimane abbiamo iniziato un ragionamento sulla diffusione dell’assistenza vocale. Ho parlato di come, piano piano Tutti i nostri dispositivi vogliono parlare e del perché sempre più assistenti vocali hanno qualcosa da dire come sostenuto nell’articolo di Edward C. Baig dell’ USA TODAY .
Perché questo accade ora? Se già segui il blog da un po’ l’ho già detto forse in maniera breve e discontinua. Lo ripeto.
Potenza di calcolo
- Primo: perché è aumentata la quantità di potenza a disposizione dei singoli utenti.
Pensateci. Dopo il primo iPhone che rivoluzionò il mercato, i successivi modelli di smartphone, di tutti i brand, si sono limitati a potenziare il primo modello. In sempre meno spazio abbiamo sempre più potenza. Con sempre più potenza abbiamo costi sempre più contenuti. E almeno, fin quando non sarà trovato un dispositivo, ancor più rivoluzionario, il trend di potenziamento dell’esistente non sarà interrotto.
AGGIORNAMENTO Luglio 2017
Sul tema trovi il mio articolo sull’ iPhone7
Big data
- Secondo: la raccolta e l’estrazione di enormi quantità di dati a nostra disposizione, anche eterogenei, conosciuti come Big Data.
I Big Data sono raccolte di dati estesi in termini di volume (grandi quantità appunto), che viaggiano a grandi velocità e che sono altrettanto eterogenei nel loro contenuto.
Non sono un esperto di Big Data e nei commenti potete correggere quanto sto per dire. Un esempio di Big Data è un algoritmo che in base alle ricerche che una donna fa sul web, delle parole ricercate, delle pagine che legge più di frequente, capisce e predice che quella donna è incinta.
L’estrazione di questo valore è complesso e richiede tecnologie e metodi analitici specifici. Ma come ben sapete alla prima ricerca commerciale di un prodotto tutti ci ritroviamo quel prodotto o altri prodotti simili tra le mail o sui social. I Big Data e la loro diffussione hanno contribuito molto a migliorare l’attivazione vocale, di pari passo con i progressi fatti dal Deep Learning e dagli studi sulle reti neurali.
Potenza di calcolo a disposizione di tutti
- Terzo: tutta questa potenza e capacità di calcolo, tutta questa immensa quantità di informazioni ce la portiamo in tasca.
Il cambiamento che stiamo vivendo, come ricorda sempre Federico Badaloni, “è un cambiamento culturale e non tecnologico. La tecnologia tende sempre più a nascondersi.” Oggi con una applicazione sul nostro smartphone riusciamo a scrivere, comunicare con gruppi più o meno numerosi, che si trovano in contesti diversi; possiamo modificare siti web o creare podcast, editare video, senza toccare neppure una riga di codice o dover seguire corsi di formazione per la regia.
Non importa a nessuno quanto complesso sia il lavoro o il codice dietro l’applicazione. A tutti interessa cosa fa e come lo fa. Seppure la frase “il mondo sta cambiando” o “il mondo è cambiato” è il mantra di molte discussioni sul futuro del nostro mondo occidentale, ancora non conosciamo la portata del cambiamento culturale che stiamo vivendo. Vedere in giro persone che camminano per strada senza staccare gli occhi dallo schermo del proprio smartphone è solo un sintomo. I cambiamenti veri stanno avvenendo molto più in profondità.
Riconoscimento vocale alto
- Quarto: da una ricerca fatta da Google, i tassi di errore di riconoscimento vocale sono in discesa e si attestano intorno all’8% rispetto a circa il 25% di errore che si aveva fino a pochi anni fa.
Tanto più gli assistenti vocali migliorano, tanto più migliora e aumenta il livello di confidenza degli utenti, che dunque sono maggiormente spinti a usarli.
Secondo un recente sondaggio condotto da MindMeld, una piattaforma di interfacce vocali, il 2015 è stato l’anno della svolta per l’adozione di assistenti vocali su smartphone. Il 55% degli utenti interpellati hanno usato regolarmente gli assistenti vocali nei tre mesi presi in esame, un 6% in più rispetto al trimestre precedente.
E poco meno della metà degli intervistati da Mindmeld hanno dichiarato di essere soddisfatti dai loro assistenti vocali, rispetto al 13% che invece sono insoddisfatti.
AGGIORNAMENTO Luglio 2017
Vedi i nuovi risultati sonori del report dei trend dei nuovi business emergenti
Assistenza vocale adesso?
Per quanto i progressi siano stati tanti, ed io sia fermamente convinto che sia il momento buono per l’assistenza vocale. Il mondo è ancora molto rumoroso e questo pone delle grandi sfide. Non solo il mondo è rumoroso, noi umani non parliamo tutti allo stesso modo; accenti, cadenze, espressioni colloquiali e tutte le nostre imperfezioni linguistiche mettono a dura prova gli assistenti vocali e gli sviluppatori.
Persino Vlad Šejnoha, CTO di Nuance, la compagnia che ha fornito la tecnologia per sviluppare Siri ammette:
Stiamo cercando di capire meglio che cosa dice la gente. Ma poi far eseguire un comando in modo efficiente è una bella sfida.
Eppure la strada è aperta. Echo di Amazon riconosce la tua voce ed esegue il comando anche durante la produzione di musica, il che significa che le soluzioni, seppur difficili, ci sono.
A frenare, in questo momento, gli sviluppi sempre più veloci e all’avanguardia, sono più i problemi etici che quelli tecnologici.
Ci torniamo la prossima settimana!
AGGIORNAMENTO Luglio 2017
Scopri cosa sono e a cosa servono gli Smart Speakers
Caro Toni,
il tuo articolo tocca vari punti importanti e te ne ringrazio.
Due note personali:
– la mia compagna é Giuditta Del Buono, con lei abbiamo cerato la prima conferenza italiana su questi temi nel lontano 2016 🙂 bit.ly/convcomp2016 🙂
– non mi sento molto nella nicchia dei “curiosi”, che immagino essere quelli che provano qualsiasi nuovo “oggetto” tech. Sono semmai nella deprecabile nicchia degli “intellettuali”… o peggio degli “ideologi” (della venuta del cambio di paradigma di comunicazione, da visuale a conversazionale). Nel 2016 ipotizzavo che gli assistenti vocali sarebbero stati il passo successivo ai chatbot sull’instant messaging su telefono. Ora non ride più nessuno. Alla peggio si chide nella cuccia facendo finta di non vedere cosa succede fuori e continua a pensare che vivrà facendo siti web 😀 il chè, vista l’arretratezza italiana, potrebbe essere anche vero per qualche anno.
Chiudo parentesi.
Due considerazioni generali, ben più importanti di quelle personali:
– l’esempio della scopa è perfetto a mio avviso e sono purtroppo d’accordo con te sul fatto che gli assistenti vocali (in casa) potrebbero diventare in prossimo futuro l’accesso ad internet per le persone “inalfabete”. Questa “digital divide” è un tema di mostruosa importanza, di cui in Italia non si occupa ancora quasi nessuno (fammi sapere se sbaglio). Uno dei motivi per cui io e Giuditta organizzammo la conferenza è proprio perché volevamo trattare questo punto che già allora sentivamo urgente.
– A riguardo dell’Architettura dell’Informazione: colgo la tua ironia probabilmente rivolta verso i teorici del bel colore sul pulsante. Non ti curar della loro negligenza e tira dritto. Ci sono problemi più importanti e tu li riconosci.
Con rispetto
Giorgio
Grazie a te Giorgio,
per l’attenzione, ma soprattutto per il tuo prezioso contributo. Speriamo di poter allargare il pubblico e così anche la discussione. Noi stiamo facendo la nostra parte. Vediamo se altri vorranno contribuire.
Con gratitudine!