Lo scorso 25 maggio, Stroncature ha ospitato un incontro dal titolo “Etica algoritmica e bias di genere: i dati non sono neutri”. L’appuntamento si è inserito nelle attività di Terza Missione promosse da Stroncature in collaborazione con il Dipartimento di Informatica dell’Università degli Studi di Bari Aldo Moro, nel quadro del progetto di Public Engagement “UNIBA 2030 – Intelligenza Artificiale e Sostenibilità”, selezionato nell’ambito delle iniziative di Public Engagement “Patto Territoriale Sistema Universitario Pugliese”. Nel corso del webinar sono intervenuti la prof.ssa Francesca Alessandra Lisi, il prof. Marco de Gemmis e la dott.ssa Lucia Siciliani, afferenti al Dipartimento di Informatica dell’Università degli Studi di Bari Aldo Moro.
Quando si parla di intelligenza artificiale, si tende spesso a immaginarla come una tecnologia capace di produrre risultati oggettivi. Il webinar ha mostrato invece un quadro più complesso: i sistemi di IA non operano mai nel vuoto, ma dipendono dai dati con cui vengono costruiti, dalle regole con cui vengono addestrati, dai contesti in cui vengono usati e dai criteri con cui vengono valutati. Per questo il titolo dell’incontro, “i dati non sono neutri”, non aveva il valore di una formula polemica, ma indicava un punto di fondo: parlare di intelligenza artificiale significa parlare anche di etica, di responsabilità e di possibili distorsioni che la tecnologia può riprodurre o amplificare. Ad aprire il webinar è stata la professoressa Francesca Alessandra Lisi, che ha collocato il tema all’incrocio tra tre ambiti di ricerca: intelligenza artificiale, etica e studi di genere.
La professoressa ha inquadrato la questione dentro il paradigma europeo della Responsible Research and Innovation, ricordando che l’innovazione tecnologica, soprattutto quando ha un forte impatto trasformativo, non può essere giudicata solo per la sua efficacia tecnica. In questo quadro assumono rilievo etica, accesso aperto ai risultati della ricerca, formazione, dimensione di genere e public engagement. La stessa idea di un’intelligenza artificiale “affidabile” implica requisiti come supervisione umana, robustezza, sicurezza, privacy, trasparenza, non discriminazione, equità e accountability. L’etica algoritmica, quindi, non coincide soltanto con il contrasto alle discriminazioni, ma riguarda più in generale il modo in cui costruiamo sistemi che entrano nella vita delle persone e incidono su decisioni delicate.
Ha poi distinto tra etica delle macchine ed etica degli esseri umani che progettano, costruiscono e usano macchine intelligenti. Il punto è importante, perché sposta la discussione da una domanda astratta — le macchine possono essere morali? — a un problema molto più concreto: quali condizioni rendono accettabile una simbiosi tra esseri umani e agenti artificiali. Per chiarirlo, il webinar ha richiamato prima il Moral Machine Experiment, che ha mostrato quanto sia difficile individuare un sistema valoriale universale valido per tutti i contesti culturali, e poi il caso di un robot badante incaricato di monitorare una terapia. Se un robot badante deve ricordare a un paziente di assumere una terapia e il paziente rifiuta, il sistema dovrebbe insistere o rispettare la sua decisione? Qui entrano in tensione il rispetto per l’autonomia della persona e il dovere di evitare un danno. La soluzione proposta dal gruppo di Bari parte dalla valutazione del rischio etico e dalla necessità che l’agente artificiale sia anche in grado di spiegare il proprio comportamento.
La seconda questione affrontata ha riguardato il bias di genere. Nel webinar il bias è stato descritto come il punto di arrivo di un circuito che lega stereotipi, pregiudizi e discriminazione. Gli algoritmi di apprendimento automatico non inventano da zero questi meccanismi, ma possono assorbirli dai dati e riprodurli su larga scala, diventando una cassa di risonanza di storture già presenti nella società. Per mostrare quanto il problema sia concreto sono stati richiamati due casi ormai classici: i sistemi di riconoscimento facciale che si sono rivelati molto più accurati nel riconoscere volti maschili bianchi che non volti femminili o persone con la pelle scura, e il sistema COMPAS, usato nella giustizia predittiva statunitense, che ha mostrato forti squilibri nella stima del rischio di recidiva, con effetti particolarmente pesanti nei confronti delle persone nere e, in modo ancora pimarcato, delle donne nere. Il punto decisivo è che il bias non è soltanto un difetto tecnico: è un problema socio-tecnico che nasce dall’intreccio tra sistemi digitali e disuguaglianze sociali.
Il secondo intervento è stato del prof. Marco de Gemmis, che ha concentrato la sua attenzione sui Large Language Model (LLM), come ChatGPT, che stanno diventando sempre più parte integrante della nostra quotidianità Il professore ha spiegato che questi sistemi sono addestrati analizzando grandi volumi di documenti, sviluppando così la capacità di predire la parola che dovrebbe seguire una certa frase. Per questo motivo, un modello linguistico può produrre risposte coerenti e convincenti, grazie alla fluidità linguistica acquisita nella fase di addestramento, ma questo non significa che sia davvero affidabile. È da questo meccanismo che nascono le ‘allucinazioni’, risposte all’apparenza credibili, che in realtà contengono errori fattuali o dettagli del tutto inventati. È famoso il caso, avvenuto negli Stati Uniti, di avvocati che hanno citato in tribunale precedenti legali del tutto inesistenti, in quanto la documentazione presentata era stata generata con ChatGPT e mai ricontrollata. Il professore ha anche ricordato che questi modelli possono riprodurre stereotipi di genere in modo spontaneo: se a un sistema si chiede, per esempio, di generare l’immagine di un medico con due assistenti, il risultato potrebbe riprodurre il classico stereotipo che associa il medico ad una figura maschile e il ruolo di supporto a figure femminili. Anche per questo, il punto centrale del suo intervento è stato il richiamo a un uso consapevole di questi strumenti, che non possono essere trattati come fonti infallibili né considerati neutrali.
Il prof. de Gemmis ha inoltre richiamato l’attenzione su un altro aspetto rilevante: anche gli LLM riflettono i contesti linguistici, culturali e geografici in cui vengono sviluppati e addestrati. Le loro risposte, quindi, possono presentare inclinazioni diverse non solo rispetto al genere, ma anche rispetto a temi politici, sociali e valoriali. In quest’ottica, la questione della neutralità va oltre gli errori o i pregiudizi più evidenti, ma riguarda direttamente la natura dei dati di partenza e l’architettura con cui i modelli vengono addestrati. Proprio per questo, il professore ha insistito sul fatto che la parola chiave, anche in questo caso, sia consapevolezza: usare questi modelli significa sapere che non ragionano come un essere umano, ma producono testo sulla base di correlazioni statistiche apprese dai dati.
La terza relatrice, la dott.ssa Lucia Siciliani, ha mostrato come questo problema si ponga con particolare evidenza per l’italiano. Nei modelli più diffusi, infatti, la quota di dati nella nostra lingua è minima rispetto all’inglese. Da qui nasce il lavoro su LLaMAntino, la famiglia di modelli sviluppata a Bari a partire da LLaMA e adattata all’italiano attraverso fine-tuning, anche grazie alla collaborazione con CINECA e all’uso del supercomputer Leonardo. La ricercatrice ha spiegato questo processo con una metafora semplice ed efficace: quella di un grande mixer audio con moltissime manopole. Addestrare da zero un modello significa regolarle tutte da capo; il fine-tuning, invece, parte da un sistema già esistente e ne modifica solo una parte, per adattarlo meglio a una lingua o a un compito specifico. L’obiettivo, in questo caso, è migliorare le prestazioni dei modelli in italiano e renderli più adatti ai nostri contesti d’uso.
La prof.ssa Lucia Siciliani ha poi presentato un possibile ambito di impiego degli LLMs nel riconoscimento e nella prevenzione della violenza di genere. Docenti e studenti del Dipartimento di Informatica di Bari hanno sviluppato una visual novel interattiva in cui giovani donne si confrontano con situazioni tipiche di relazioni tossiche. L’utente interpreta la possibile vittima, mentre il ruolo dell’aggressore è affidato a un LLM che, addestrato per questo compito specifico, genera risposte naturali e tossiche, mettendo in scena dinamiche come isolamento, gaslighting e cyberstalking. Il progetto, realizzato con la preziosa collaborazione di colleghe del Dipartimento di Psicologia, ha un duplice obiettivo: da un lato sensibilizzare le partecipanti a riconoscere i segnali di una relazione tossica o violenta; dall’altro costruire conversazioni più realistiche da usare per addestrare sistemi capaci di individuare messaggi tossici nelle chat e segnalarli al fine di evitare situazioni di potenziale pericolo. Il suo intervento ha così mostrato che l’intelligenza artificiale può essere impiegata anche come strumento di prevenzione, purché sia progettata con attenzione, consapevolezza e responsabilità.








