Amazon, che sembra non aver avuto ripercussioni dalla pandemia,potrebbe non aver svelato il segreto della felicità ma con l’annuncio di un nuovo strumento di monitoraggio vocale chiamato Tone, incluso nel suo nuovo Health Tracker, l’azienda promette di sapere come suona la felicità. E che – con un nuovo gadget e una piccola traccia – anche tu puoi sembrare felice.
Tone: la proposta di Google per monitorare il tono della voce
Tone sarà una caratteristica del nuovo tracker sanitario indossabile di Amazon, soprannominato Halo. Gli utenti possono scegliere di fargli assaggiare frammenti del loro discorso durante il giorno, o accenderlo per un massimo di 30 minuti alla volta per ottenere un rapporto dettagliato su come hanno suonato in una particolare conversazione.
Alimentato da algoritmi di IA progettati per rilevare la “positività” e l'”energia” nelle voci umane, lo strumento si propone di offrire agli utenti un feedback sul loro tono in modo che possano migliorare le loro capacità di comunicazione e le loro relazioni.
Naturalmente, è difficile definire tratti sfumati come la positività, ed è un compito ancora più erculeo addestrare un modello di IA per quantificarli e misurarli in modo oggettivo. In un post del blog, Amazon dice semplicemente che la “positività” misura quanto suoni felice o triste una voce.
Ma l’umanità (e il campo della psicologia positiva) hanno lottato per definire la felicità per eoni.
“Mi è difficile immaginare che ci possa essere un’unica misura oggettiva”, ha detto Jim Allen, professore associato di psicologia alla State University of New York di Geneseo, che scrive e insegna la psicologia della felicità. La nostra percezione di come suona una voce felice, osserva, varia a seconda della cultura, del genere, dell’etnia e di altri fattori personali.
Un portavoce di Amazon ha detto che gli sviluppatori hanno tenuto conto di queste differenze attingendo a campioni vocali da decine di migliaia di voci provenienti da diverse regioni e gruppi demografici degli Stati Uniti. Un team di dipendenti di Amazon ha poi ascoltato le registrazioni e ha valutato le voci come felici o tristi per determinare la “positività” e stanche o eccitate per misurare l'”energia”.
Il modello associava queste valutazioni emotive a qualità vocali come l’intonazione, l’intensità, il tempo e il ritmo, che l’IA usa per etichettare il discorso degli utenti.
I set di formazione, tuttavia, sono altamente suscettibili a pregiudizi da parte degli esseri umani che li costruiscono, come i ricercatori hanno ampiamente documentato in campi come il riconoscimento facciale. Questo rende molto importante il controllo dei dati e delle persone che li etichettano. Amazon si è rifiutata di offrire qualsiasi dettaglio sulla ripartizione demografica dei suoi campioni vocali, o sul team le cui percezioni di positività ed energia costituiscono la base del modello. “Nel corso dello sviluppo del prodotto, ci siamo concentrati sull’assicurare che i dati che utilizziamo per formare e valutare i nostri modelli corrispondano a tutti i gruppi demografici”, ha detto un portavoce in un’e-mail.
In contesti particolari, Allen ha detto che una versione di uno strumento come Tone potrebbe funzionare bene. “Nelle mani di un consulente esperto che fornisce un feedback a un cliente su come si relaziona con altre persone, potrebbe essere davvero utile“, ha detto. Ma, ha osservato, monitorando costantemente se stessi in cerca di segni di felicità – o peggio, proiettando una positività che non si sente – ha dimostrato di rendere le persone meno felici.
Pattie Maes, una professoressa del MIT che studia la tecnologia indossabile progettata per migliorare la vita delle persone, ha sottolineato che l’IA avrebbe più probabilità di restituire risultati significativi se non cercasse di trattare la felicità come una verità universale. “Le persone hanno stili di linguaggio diversi”, ha detto in un’e-mail. “Credo che un modello di Intelligenza Artificiale personalizzata addestrato sui dati di un individuo avrebbe prestazioni migliori”. (Mentre Tone impara a scegliere la voce di un utente in una conversazione, non calibra le sue valutazioni sulla base emotiva di quell’utente).
Ma questi approcci per aumentare la validità del modello non sono compatibili con le tecnologie di consumo di massa. Nel suo post sul blog di annuncio, il medico ufficiale di Amazon Maulik Majmudar descrive un gadget che esce da una scatola pronta a convincere gli utenti a comunicare meglio. Scrive della facilità con cui i suoi colleghi possono accendere Tone e fare le prove per una grande presentazione al lavoro. Majmudar dice che accende il sistema prima di parlare con i suoi figli, per essere sicuro di non stressare la sua famiglia per il lavoro.
È una visione intrigante per un futuro con l’IA. Ma potrebbe non essere quello in cui viviamo ora.