Una riproduzione tutt'altro che casuale: come funziona davvero l'algoritmo di Spotify

Perché le piattaforme conoscono così bene i nostri gusti musicali? Quante informazioni raccoglie da un nostro skip? E quali sono i pro e i contro di questo sistema? A queste e altre domande risponde la cantautrice e matematica esperta in AI Irene Buselli

Immagine dallo spettacolo "Apologue 20247"
Immagine dallo spettacolo "Apologue 20247"
10/03/2026 - 11:40Scritto da Irene Buselli

"E di lavoro vero cosa fai?". Alla più fastidiosa delle domande che chi fa musica si sente rivolgere regolarmente, la cantautrice Irene Buselli ha una risposta parecchio interessante. Lei, che abbiamo imparato a conoscere sia col suo progetto solista che assieme al collettivo Canta fino a dieci, ossia uno degli esperimenti più sani di condivisione artistica presenti in Italia, ogni giorno ha a che fare con qualcosa di molto meno "emozionante", almeno per chi ha una certa allergia nei confronti delle materie scientifiche: Irene è una matematica specializzata in Data Science, con un dottorato in Reliable Artificial Intelligence.

Il lavoro di Irene consiste principalmente in due branche: nello sviluppo di nuove applicazioni AI nell’ambito dei trasporti, da un lato, mentre e dall'altro è impegnata nella ricerca sull’AI Trustworthiness, ossia "su come rendere l’intelligenza artificiale più 'affidabile' anche da un punto di vista etico, in particolare evitando che apprenda e replichi le discriminazioni umane", come ci ha spiegato. 

Da esperta che maneggia algoritmi ogni giorno, ci sembrava proprio la persona migliore per capire meglio il funzionamento del sistema di machine learning di una piattaforma come Spotify, a cui milioni di utenti si affidano ogni giorno. Qua sotto quello che ci ha raccontato.

Il concetto di algoritmo è molto precedente rispetto all’informatica moderna (per dare un riferimento, la parola viene dal nome di un matematico persiano del IX secolo, Al-Khwarizmi) e, di per sé, indica un elenco fisso di operazioni in sequenza: se ogni mattina tu spegni la sveglia, scrolli i social per 10 minuti, ti alzi e ti lavi i denti, la sequenza di queste operazioni è un algoritmo. Nel mondo dell’informatica un algoritmo è un blocco di istruzioni, tipicamente all’interno di un software, che si svolgono in serie: per fare un esempio qualsiasi, se un programma sa mettere delle parole in ordine alfabetico è perché c’è sotto un algoritmo che, scorrendo passo passo ogni parola, calcola se essa debba essere posizionata prima o dopo, finché non arriva all’ordinamento finale. 

video frame placeholder

Gli algoritmi di cui tanto si parla negli ultimi anni sono però una sottocategoria particolare, ovvero algoritmi di apprendimento automatico (Machine Learning in inglese, termine che ormai nel linguaggio comune è praticamente sovrapponibile a Intelligenza Artificiale, e che quindi da qui in poi sostituisco con AI, tenendo a mente che è un’approssimazione). Un algoritmo di AI è quindi un algoritmo che apprende autonomamente dai dati che gli vengono forniti, invece di seguire delle istruzioni direttamente dettate da un umano. Posso dire che anche io sviluppo algoritmi, anche se nella maggior parte dei casi il mio lavoro è prendere il codice di algoritmi già conosciuti e apportare modifiche che li rendano più adatti al tipo di problema che devo modellare in quel momento (in termini sia etici che di performance).

Per fare un esempio, immaginiamo di volere un software che distingua i cani dai gatti: un algoritmo “classico” sarebbe un lunghissimo elenco di “se nei pixel centrali ha delle strisce chiare che sembrano vibrisse, è un gatto”, “se nella parte alta della foto ha delle orecchie simili a triangoli, è un gatto”, eccetera (risultando ovviamente sempre troppo approssimativo e soggetto a errori di ogni tipo), mentre a un algoritmo di AI si danno in pasto 10000 foto di cani e 10000 foto di gatti affinché impari da sé a distinguerli nel modo più efficace (approccio che nella maggior parte dei casi funziona infinitamente meglio).

Ovviamente, anche nell’algoritmo di AI ci sono delle istruzioni di base scritte da esseri umani, solo che assomigliano di più a “considera queste foto di cani e gatti nello spazio matematico del prodotto dei pixel e con un paio di derivate calcola il modo più accurato per separarle” – motivo per cui spesso non è davvero possibile capire perché un algoritmo di AI ha dato una risposta e non un’altra.

Gli algoritmi delle piattaforme come Spotify (ma anche Netflix o Amazon) si definiscono algoritmi di recommendation, nel senso che “suggeriscono” cosa vedere o ascoltare dopo. Come quasi tutte le app che usiamo, compresi i social, i sistemi di recommendation sono basati da sempre su algoritmi di AI. L’algoritmo di Spotify, in particolare, è complesso ma non troppo misterioso: ci sono diverse pubblicazioni, anche prodotte dalla piattaforma stessa, che ne descrivono il funzionamento in modo abbastanza preciso, anche se ovviamente non sapremo mai tutti i dettagli del codice.  

Anzitutto, è interessante capire come Spotify profila le canzoni. Per ogni traccia, la piattaforma ha a disposizione:

- i metadati inseriti dal distributore (artista, etichetta, crediti, ma anche descrizione del mood, lingua, genere, cover/originale, artwork, ecc.);

- almeno una cinquantina di feature estratte in modo automatico dall’audio, tra cui: ballabilità, tonalità, energia, bpm, acusticità, presenza del cantato, qualità della registrazione, struttura, posizione del ritornello, presenza di un’intro, ecc.;

- un punteggio di “popolarità” (sia locale sia internazionale);

- una serie di informazioni prodotte da analisi testuale: dai testi ai titoli delle playlist in cui gli ascoltatori mettono la traccia alla bio degli artisti, più (ma di questo ho trovato un riscontro meno solido) informazioni trovate al di fuori della piattaforma, come recensioni, menzioni social, ecc.

Anche i brani sponsorizzati in realtà probabilmente non “bypassano” l’algoritmo, ma sono integrati in questo flusso. Quello che immagino (e che sono riuscita a mettere insieme da un po’ di fonti online) è che il punteggio di “suggeribilità” di una canzone possa essere calcolato grosso modo come affinità + altri incentivi, e che quindi l’incentivo economico dato a una canzone “gonfi” leggermente il punteggio base, allargando la fetta di utenti a cui verrà proposta.

Contemporaneamente Spotify profila anche gli ascoltatori, individuandone le preferenze e i comportamenti, attraverso feedback espliciti (salvataggi, aggiunte a playlist, skip, ecc.) e impliciti (lunghezza delle sessioni di ascolto, numero di ripetizioni, ecc.), deducendo quindi le canzoni, gli artisti e i generi preferiti, i momenti della giornata preferiti per l’ascolto, la predisposizione alla novità e così via. 

A questo punto, a seconda del tipo di recommendation che deve produrre (es: Discover Weekly, Release Radar, Daily Mix, Personalized Editorial) Spotify calcola:

- l’affinità tra canzoni e utente, data sia dalle informazioni elencate sopra sia dal cosiddetto collaborative filtering (es: utente A e utente B hanno le prime 10 canzoni preferite in comune, è probabile che l’undicesima canzone preferita di B piaccia ad A e viceversa);

- l’affinità tra canzoni e tra artisti (se ad esempio due canzoni/artisti compaiono sempre insieme nelle playlist fatte dagli utenti, facilmente saranno simili e facilmente andranno insieme anche nelle playlist algoritmiche).

È così che decide quindi che canzoni suggerire a chi. Chiaramente, algoritmi come questo imparano in continuazione dal comportamento degli utenti, in base ai feedback diretti o indiretti che ricevono.

video frame placeholder

Ormai da diversi anni gli studi sono tendenzialmente concordi sul fatto che dai nostri ascolti si riesca a dedurre in buona parte sia cosa stiamo facendo (molto spesso c’è un tipo di musica che ascoltiamo in palestra, uno che ascoltiamo lavorando, uno mentre siamo in metro) che come ci sentiamo (c’è parecchia letteratura scientifica, ad esempio, su quanto ascoltiamo musica congruente o incongruente al nostro stato d’animo e come correlare le due cose). 

Inoltre, Spotify può anche dedurre facilmente (è il suo lavoro) se siamo persone più o meno aperte alle novità musicali, o se le nostre preferenze sono riconducibili a specifiche aree culturali e politiche: per fare un esempio, se una mia playlist si chiama “spaghettata antifascista” e la mia canzone più ascoltata è Giorgia nel Paese che si meraviglia di Willie Peyote è abbastanza chiaro, se non per chi ho votato, almeno per chi non ho votato.

C’è una parte di grande fascino e utilità in questa tecnologia, e la possibilità di trovare così facilmente nuova musica in linea con i nostri gusti ha dei vantaggi oggettivi rispetto al navigare senza guide in mezzo a una quantità di tracce ormai pressoché infinita. Ci sono però, secondo me, almeno tre aspetti problematici

Il primo, che conosciamo ormai tutti benissimo anche dai social, è l’effetto “bolla”: la piattaforma ha tutto l’interesse a propormi solo musica che già sa che può piacermi, e questo significa che, se seguo l’algoritmo, raramente entrerò in contatto con cose diverse. 

Il secondo punto è che questo sistema, unito al funzionamento di Spotify in generale, tende a renderci ascoltatori molto più passivi: non solo non dobbiamo cercarci attivamente la musica, ma potenzialmente possiamo mettere play su una playlist che Spotify ha fatto per noi e nel frattempo fare altro e distrarci in ogni modo, tanto alla musica ci pensa lui. C’è un bel libro di Liz Pelly uscito negli scorsi mesi, Mood machine. The rise of Spotify and the Cost of the Perfect Playlist, che analizza in modo decisamente disincantato gli effetti di Spotify sulla nostra fruizione della musica e in particolare questo tipo di ascolto totalmente passivo – quando non, addirittura, puramente funzionale ad altre attività.

Il terzo problema è che, come molti sistemi di AI, stiamo parlando sostanzialmente di un “replicatore di ciò che è maggioritario”. Se in altri ambiti questo fenomeno è studiato da anni (sappiamo, ad esempio, che i primi riconoscitori facciali andavano fortissimo sui bianchi e male sulle persone nere perché addestrati su dati sproporzionati), nell’intrattenimento ci facciamo meno caso, ma i concetti di feedback loop e di recommendation bias esistono e ci dicono che, in media, ciò che già funziona verrà suggerito sempre di più dall’algoritmo, mentre ciò che parte con minore popolarità tenderà a non acquisirne.

---
L'articolo Una riproduzione tutt'altro che casuale: come funziona davvero l'algoritmo di Spotify di Irene Buselli è apparso su Rockit.it il 2026-03-10 11:40:00

COMMENTI

Aggiungi un commentoavvisami se ci sono nuovi messaggi in questa discussioneInvia