PhD Research Project — Big Data and Artificial Intelligence

FLOPBG

Federated Learning in Dynamic and Heterogeneous Environments:
A Simulation Platform for Privacy-Preserving Medical AI

OPBG Ospedale Pediatrico Bambino Gesù
|
Mercatorum Universitas Mercatorum
Fabio Liberti — Dottorato in Big Data and Artificial Intelligence

Il Progetto

FLOPBG nasce dalla collaborazione scientifica tra l'Ospedale Pediatrico Bambino Gesù (IRCCS), il più grande centro di ricerca e cura pediatrica in Europa, e l'Università delle Camere di Commercio Italiane (Universitas Mercatorum), nell'ambito del Dottorato di Ricerca in Big Data and Artificial Intelligence.

Il progetto affronta una delle sfide più rilevanti dell'AI in sanità: come addestrare modelli di deep learning per la diagnosi medica per immagini quando i dati clinici sono distribuiti tra molteplici istituzioni e non possono essere condivisi centralmente per vincoli di privacy (GDPR), sovranità dei dati e regolamentazioni sanitarie nazionali ed internazionali.

La piattaforma è un sistema full-stack di simulazione e sperimentazione per il Federated Learning, progettato per valutare e confrontare strategie di addestramento distribuito rispetto ad approcci centralizzati, con particolare focus sull'imaging medico diagnostico — dalla radiologia pediatrica alla dermatologia oncologica, dalla tubercolosi alla retinopatia diabetica.

Abstract

Il Federated Learning (FL) rappresenta un cambio di paradigma nell'addestramento distribuito di modelli di machine learning, consentendo a molteplici istituzioni di collaborare senza condividere i dati grezzi. Questa piattaforma di simulazione affronta le sfide reali del FL in ambito clinico: eterogeneità computazionale tra i nodi partecipanti (ospedali con risorse diverse), dinamismo nella partecipazione (disponibilità variabile dei client), distribuzione non-IID dei dati (casistiche cliniche diverse per sede), e vincoli di comunicazione (banda limitata, latenza variabile). Il framework implementa e confronta quattro algoritmi di aggregazione federata — FedAvg, FedProx, SCAFFOLD e FedNova — con meccanismi avanzati di quantizzazione dei pesi, sistema di reputazione dei client, e supporto per scenari multi-scala (nazionale, europeo, globale), con particolare applicazione all'imaging medico diagnostico.

Framework Overview

FLOPBG Framework Infographic

Methodology Diagram

FLOPBG Methodology Diagram

A sinistra, una panoramica sintetica dell'intero framework — dal problema scientifico alle feature implementate. A destra, il diagramma metodologico dettagliato con il flusso operativo completo: configurazione, motore FL (client/server), aggregazione e valutazione dei risultati.

Contributi di Ricerca Principali

Il framework integra sette componenti chiave che affrontano le principali sfide del Federated Learning in ambienti reali, dalla gestione dell'eterogeneità dei nodi al sistema di raccomandazione per la selezione ottimale di algoritmo e configurazione.

{}
FL Algorithms

Implementazione di 12 algoritmi FL (FedAvg, FedProx, SCAFFOLD, FedNova, FedExP, FedDyn, MOON, FedDisco, FedSpeed, FedLPA, DeepAFL, FedEL) per confrontare aggregazione, variance reduction, contrastive learning e selezione dinamica.

Client Heterogeneity

Simulazione realistica di nodi con potenza computazionale e velocità di rete variabili (strong, medium, weak), riflettendo le disparità infrastrutturali reali.

Client Dynamism

Modellazione della partecipazione intermittente dei client (fast, normal, slow) con tassi di partecipazione configurabili per simulare scenari realistici.

Non-IID Data Distribution

Supporto per distribuzioni non identicamente distribuite dei dati tra i nodi, condizione tipica degli scenari clinici multi-istituzionali.

Weight Quantization

Compressione dei pesi del modello (32, 16, 8 bit) per ridurre i costi di comunicazione, cruciale per nodi con connettività limitata.

Reputation System

Sistema di reputazione basato sulle prestazioni dei client per ponderare i contributi durante l'aggregazione, migliorando la robustezza del modello globale.

🎯
Recommendation System

Sistema di raccomandazione condizionale che suggerisce algoritmo e iperparametri ottimali in base al dataset selezionato, considerando complessità, distribuzione e caratteristiche cliniche.

Architettura del Framework

La pipeline di sperimentazione segue un flusso sequenziale in sei fasi: dalla selezione del dataset alla valutazione finale, passando per la configurazione dei client, il deployment geografico dei nodi, l'addestramento federato e l'aggregazione dei pesi.

Architettura del Framework: Pipeline di Sperimentazione
Dataset Supportati
Benchmark
MNIST10 classi
Fashion-MNIST10 classi
CIFAR-1010 classi
CIFAR-100100 classi
SVHN10 classi
Clinical Imaging
Chest X-Ray2 classi
ISIC Skin Lesion9 classi
Brain Tumor4 classi
Brain Tumor MRI4 classi
Retinopathy5 classi
Skin Cancer2 classi
Stack Tecnologico
BackendPython, Flask, TensorFlow / Keras
FrontendReact, Chart.js, react-simple-maps
FL FrameworkFedAvg, FedProx, SCAFFOLD, FedNova
Data ProcessingNumPy, Scikit-learn, Pillow
VisualizationChart.js (metrics), D3.js (geo maps)
CommunicationREST API, JSON, YAML configuration
Algoritmi di Federated Learning
Algoritmo Descrizione Ambito consigliato Riferimento
Avg FedAvg
Media pesata dei pesi per numero di campioni. Algoritmo base del Federated Learning, semplice ed efficace con dati IID. Benchmark, dati IID, baseline di confronto McMahan et al., 2017
Prx FedProx
Aggiunge un termine prossimale alla loss locale per vincolare i pesi vicino al modello globale, migliorando la convergenza in ambienti eterogenei. Dati non-IID, nodi eterogenei Li et al., 2020
SCA SCAFFOLD
Utilizza control variates (server/client) per correggere il drift dei gradienti locali, riducendo la varianza su dati non-IID. Forte non-IID, molti client, EHDS Karimireddy et al., 2020
Nov FedNova
Normalizza i contributi per il numero di gradient steps locali, eliminando il bias da epoche e dataset size diversi tra nodi. Nodi con risorse disomogenee, scenari globali Wang et al., 2020
ExP FedExP
Estrapolazione lato server: calcola dinamicamente lo step size ottimale dai pseudo-gradienti dei client, accelerando la convergenza senza overhead. Communication-efficient, fast convergence Jhunjhunwala et al., ICLR 2023
Dyn FedDyn
Regolarizzazione dinamica: aggiorna il regolarizzatore ad ogni round per allineare gli ottimi locali con la loss globale, con convergenza più rapida. Large-scale, convergenza rapida Acar et al., ICLR 2021
Algoritmi avanzati (6 algoritmi — 2021–2025)
MON MOON
Contrastive learning a livello di modello: massimizza l'accordo tra rappresentazioni locali e globali, correggendo il drift locale su dati non-IID. Image classification, non-IID visivo Li et al., CVPR 2021
Dis FedDisco
Pesi di aggregazione basati sulla discrepanza tra distribuzione locale e globale delle categorie, con garanzie teoriche più strette. Non-IID severo, label imbalance Ye et al., ICML 2023
Spd FedSpeed
Correzione del prox-term sugli aggiornamenti locali per ridurre il bias introdotto dalla regolarizzazione, con bound di convergenza più stretto. Eterogeneità elevata, pochi round Sun et al., ICLR 2023
LPA FedLPA
Aggregazione one-shot con posterior bayesiano layer-wise: un singolo round di comunicazione sfruttando la struttura a livelli della rete neurale. One-shot FL, privacy estrema NeurIPS 2024
AFL DeepAFL
Analytic FL gradient-free: usa soluzioni analitiche (least squares) su feature estratte da modelli pre-trained, invariante al grado di non-IID dei dati. Non-IID estremo, robustezza Zhai et al., ICLR 2025
EL FedEL
Elastic learning con selezione dinamica dei tensori rilevanti per round e budget di comunicazione adattivo, bilanciando accuratezza ed efficienza. Device eterogenei, edge computing NeurIPS 2025
Scenari Multi-Scala

La piattaforma include tre Use Case preconfigurati a scale geografiche crescenti, ciascuno ispirato a scenari clinici reali con diversi livelli di eterogeneità infrastrutturale, distribuzione dei dati e vincoli di comunicazione.

Nazionale
Italia

Rete di ospedali di montagna italiani per la detection di polmonite pediatrica. Simulazione di nodi con risorse limitate e connettività variabile.

Chest X-Ray 10 nodi 100 rounds
Europeo
EHDS

Classificazione di lesioni cutanee distribuita su 12 centri in Europa nel framework EHDS. Eterogeneità tra grandi ospedali universitari e cliniche specializzate.

Skin Cancer 12 nodi 150 rounds
Globale
WHO

Rilevamento della tubercolosi coordinato dall'OMS su 15 centri in 6 continenti. Massima eterogeneità computazionale e partecipazione intermittente.

Chest X-Ray 15 nodi 200 rounds