I dati non parlano da soli
Come traduzioni, annotazioni ed etichette costruiscono il modo in cui un algoritmo riconosce la violenza nelle conversazioni
Quando si parla di intelligenza artificiale, si tende spesso a immaginare che il risultato dipenda soprattutto dalla potenza del modello. La ricerca “LLaMAntino against Cyber Intimate Partner Violence” suggerisce invece una prospettiva diversa. Prima ancora che l’algoritmo intervenga, c’è un lungo lavoro umano che decide che cosa osservare, come descriverlo e quali distinzioni contino davvero. Questo è particolarmente evidente quando l’oggetto dell’analisi non è un fatto semplice, ma un fenomeno sociale complesso come la violenza nelle relazioni. In questi casi il dato non arriva mai già definito: va raccolto, selezionato, tradotto, classificato e interpretato. La ricerca mostra con chiarezza che, senza questo lavoro preliminare, il modello non avrebbe alcuna base solida su cui costruire le proprie risposte.
La ricerca parte da un dataset già esistente, costruito a partire da frasi in spagnolo raccolte in un contesto di relazioni adolescenziali. Quelle frasi non vengono però utilizzate così come sono. Gli autori selezionano solo una parte del materiale disponibile, scegliendo un gruppo ristretto di esempi tossici per una prima sperimentazione. A questo punto interviene un altro passaggio decisivo: le frasi vengono tradotte in italiano con due diversi servizi di traduzione automatica, perché l’obiettivo è testare un modello linguistico italiano. Già qui si vede che il dato non è qualcosa di immediato. Prima di arrivare al modello, passa attraverso una serie di scelte precise: quali frasi selezionare, in quale lingua analizzarle, quali esempi usare per orientare il sistema e quali invece tenere per la verifica.
Dopo la selezione e la traduzione arriva la fase forse più importante: l’annotazione. Le frasi non vengono etichettate in modo generico come “buone” o “cattive”, ma scomposte secondo più livelli di analisi grazie al prezioso contributo di docenti afferenti al Dipartimento di Scienze della Formazione, Psicologia, Comunicazione. La ricerca spiega che a ciascuna frase vengono associate cinque informazioni: il tipo di violenza, il tipo di comportamento coinvolto nella violenza fisica, il tipo di comportamento coinvolto nella violenza cyber, il tipo di comunicazione e, quando presente, la forma specifica dell’aggressività verbale. Questo passaggio è cruciale perché mostra che riconoscere una frase tossica non significa semplicemente rilevare un tono ostile. Significa invece ricostruire la logica della relazione che quella frase esprime, distinguendo per esempio tra pressione psicologica, controllo, monitoraggio, aggressione verbale e violazione della privacy. Il dato, insomma, acquista significato solo quando contestualizzato in categorie che permettono di interpretarlo.
Questa griglia non nasce automaticamente dalle parole contenute nel dataset. Deriva da un lavoro teorico e psicologico che precede l’intervento del modello. Nella ricerca, le categorie usate per descrivere la violenza nella relazione, la violenza cyber e le forme di comunicazione aggressiva vengono definite in modo puntuale. Tutto ciò significa che il modello non scopre da solo il senso delle frasi, ma lo eredita da un sistema di distinzioni costruito da ricercatori ed esperti. In altre parole, può spiegare un caso come esempio di controllo, aggressione psicologica o violazione della privacy solo perché qualcuno ha prima stabilito che cosa rientra in queste categorie. Il dato non parla da sé, ma diventa leggibile attraverso un sistema codificato di annotazioni fornito da esperti.
Gli esempi riportati nella ricerca aiutano a vedere con grande concretezza questo passaggio. Una frase come “Se sono così geloso è perché ti amo e ci tengo a te” potrebbe sembrare, a una lettura superficiale, un segno di forte coinvolgimento affettivo. Nel dataset, invece, viene interpretata come un caso di aggressione psicologica. Lo stesso vale per la frase “Se non hai nulla da nascondere e c’è fiducia tra di noi, dammi le tue password”, che viene ricondotta a una forma di controllo esercitata attraverso strumenti digitali. In entrambi i casi, il significato non dipende solo dalle parole usate, ma dalla cornice interpretativa che permette di cogliere la dinamica di dominio contenuta nel messaggio. Senza questa cornice, si rischierebbe di leggere quelle frasi come normali espressioni di amore, fiducia o preoccupazione. È qui che si vede con maggiore evidenza che il dato non è neutro.
La ricerca mostra inoltre che neppure per gli esseri umani questo lavoro è semplice. Per valutare quanto gli annotatori coincidano nei loro giudizi, gli autori usano il coefficiente kappa di Cohen, cioè un indicatore che misura il grado di accordo tra valutatori diversi. I risultati mostrano che il riconoscimento della cyberviolenza raggiunge un accordo moderato, mentre quello sulla comunicazione aggressiva si colloca a un livello più basso. Il punto più interessante è la spiegazione di questa difficoltà: quando non ci sono parole apertamente offensive, diventa più complicato capire se una frase stia davvero esercitando pressione, intimidazione o controllo, in assenza di un contesto che ne consenta la disambiguazione. Questo dato è importante perché smentisce l’idea di una lettura automatica e oggettiva del linguaggio. Se perfino annotatori umani informati non coincidono sempre nelle loro valutazioni, allora è chiaro che il significato di queste frasi non è immediato, ma richiede interpretazione, confronto e criteri condivisi.
Su questa base, il modello linguistico viene guidato a produrre spiegazioni. Il passaggio decisivo della ricerca è che le annotazioni non servono solo a classificare le frasi, ma diventano anche il materiale da cui ricavare esempi utili per orientare il modello. In pratica, il sistema migliora quando, prima di analizzare nuove frasi, riceve pochi esempi già spiegati secondo la logica definita dagli esperti. La ricerca mostra che, in questo modo, aumenta soprattutto la capacità di riconoscere la cyberviolenza e migliora anche la qualità delle spiegazioni, che risultano più vicine a quelle assunte come riferimento. Anche qui il messaggio è chiaro: il risultato dell’intelligenza artificiale dipende dalla qualità delle istruzioni e delle categorie che la precedono. Più che su dati neutri, l’algoritmo lavora su dati già costruiti, ordinati e resi significativi da un intervento umano.
La lezione che emerge dalla ricerca è quindi molto chiara. Quando si prova a usare un modello linguistico per riconoscere fenomeni delicati come la violenza nelle relazioni, non si può pensare ai dati come a qualcosa di neutro e autosufficiente. Quelle frasi arrivano al modello dopo essere passate attraverso una serie di scelte: la selezione degli esempi, la traduzione, la definizione delle categorie, il lavoro degli annotatori, la trasformazione delle etichette in spiegazioni. Tutto questo rende possibile il funzionamento del sistema, ma allo stesso tempo ne definisce i limiti. Il modello vede ciò che le categorie gli permettono di vedere e spiega ciò che il lavoro umano precedente ha reso interpretabile. Per questo, più che di dati neutrali, la ricerca spinge a parlare di dati costruiti: una costruzione necessaria, ma che va sempre resa visibile.
Questo articolo nasce nell’ambito delle attività di Terza Missione promosse da Stroncature in collaborazione con l’Università degli Studi di Bari Aldo Moro, nel quadro delle iniziative di Public Engagement finanziate dal “Bando per Finanziamento di Iniziative di Public Engagement” a valere sul Progetto “Sistema Universitario Pugliese”, finanziato nell’ambito della misura “Patti Territoriali dell’Alta Formazione per le Imprese” (CUP F61B23000370006). Il testo rielabora in forma divulgativa il contributo scientifico “LLaMAntino against Cyber Intimate Partner Violence” di Pierpaolo Basile, Marco de Gemmis, Marco Polignano, Giovanni Semeraro, Lucia Siciliani, Vincenzo Tamburrano, Fabiana Battista e Rosa Scardigno, dell’Università degli Studi di Bari Aldo Moro, pubblicato negli atti di CLiC-it 2024: Tenth Italian Conference on Computational Linguistics, CEUR Workshop Proceedings, vol. 3878, 2024, per renderne i contenuti più fruibili a un pubblico non specialista.



