PhD Research Project — Big Data and Artificial Intelligence

FLOPBG

Federated Learning in Dynamic and Heterogeneous Environments:
A Simulation Platform for Privacy-Preserving Medical AI

Ospedale Pediatrico Bambino Gesù

Universitas Mercatorum

Fabio Liberti — Dottorato in Big Data and Artificial Intelligence

Il Progetto

FLOPBG nasce dalla collaborazione scientifica tra l'Ospedale Pediatrico Bambino Gesù (IRCCS), il più grande centro di ricerca e cura pediatrica in Europa, e l'Università delle Camere di Commercio Italiane (Universitas Mercatorum), nell'ambito del Dottorato di Ricerca in Big Data and Artificial Intelligence.

Il progetto affronta una delle sfide più rilevanti dell'AI in sanità: come addestrare modelli di deep learning per la diagnosi medica per immagini quando i dati clinici sono distribuiti tra molteplici istituzioni e non possono essere condivisi centralmente per vincoli di privacy (GDPR), sovranità dei dati e regolamentazioni sanitarie nazionali ed internazionali.

La piattaforma è un sistema full-stack di simulazione e sperimentazione per il Federated Learning, progettato per valutare e confrontare strategie di addestramento distribuito rispetto ad approcci centralizzati, con particolare focus sull'imaging medico diagnostico — dalla radiologia pediatrica alla dermatologia oncologica, dalla tubercolosi alla retinopatia diabetica.

Abstract

Il Federated Learning (FL) rappresenta un cambio di paradigma nell'addestramento distribuito di modelli di machine learning, consentendo a molteplici istituzioni di collaborare senza condividere i dati grezzi. Questa piattaforma di simulazione affronta le sfide reali del FL in ambito clinico: eterogeneità computazionale tra i nodi partecipanti (ospedali con risorse diverse), dinamismo nella partecipazione (disponibilità variabile dei client), distribuzione non-IID dei dati (casistiche cliniche diverse per sede), e vincoli di comunicazione (banda limitata, latenza variabile). Il framework implementa e confronta quattro algoritmi di aggregazione federata — FedAvg, FedProx, SCAFFOLD e FedNova — con meccanismi avanzati di quantizzazione dei pesi, sistema di reputazione dei client, e supporto per scenari multi-scala (nazionale, europeo, globale), con particolare applicazione all'imaging medico diagnostico.

Framework Overview

Methodology Diagram

A sinistra, una panoramica sintetica dell'intero framework — dal problema scientifico alle feature implementate. A destra, il diagramma metodologico dettagliato con il flusso operativo completo: configurazione, motore FL (client/server), aggregazione e valutazione dei risultati.

Contributi di Ricerca Principali

Il framework integra sette componenti chiave che affrontano le principali sfide del Federated Learning in ambienti reali, dalla gestione dell'eterogeneità dei nodi al sistema di raccomandazione per la selezione ottimale di algoritmo e configurazione.

{}

FL Algorithms

Implementazione di 12 algoritmi FL (FedAvg, FedProx, SCAFFOLD, FedNova, FedExP, FedDyn, MOON, FedDisco, FedSpeed, FedLPA, DeepAFL, FedEL) per confrontare aggregazione, variance reduction, contrastive learning e selezione dinamica.

⚖

Client Heterogeneity

Simulazione realistica di nodi con potenza computazionale e velocità di rete variabili (strong, medium, weak), riflettendo le disparità infrastrutturali reali.

⇄

Client Dynamism

Modellazione della partecipazione intermittente dei client (fast, normal, slow) con tassi di partecipazione configurabili per simulare scenari realistici.

≠

Non-IID Data Distribution

Supporto per distribuzioni non identicamente distribuite dei dati tra i nodi, condizione tipica degli scenari clinici multi-istituzionali.

▣

Weight Quantization

Compressione dei pesi del modello (32, 16, 8 bit) per ridurre i costi di comunicazione, cruciale per nodi con connettività limitata.

★

Reputation System

Sistema di reputazione basato sulle prestazioni dei client per ponderare i contributi durante l'aggregazione, migliorando la robustezza del modello globale.

🎯

Recommendation System

Sistema di raccomandazione condizionale che suggerisce algoritmo e iperparametri ottimali in base al dataset selezionato, considerando complessità, distribuzione e caratteristiche cliniche.

Architettura del Framework

La pipeline di sperimentazione segue un flusso sequenziale in sei fasi: dalla selezione del dataset alla valutazione finale, passando per la configurazione dei client, il deployment geografico dei nodi, l'addestramento federato e l'aggregazione dei pesi.

Dataset Supportati

Benchmark

MNIST10 classi

Fashion-MNIST10 classi

CIFAR-1010 classi

CIFAR-100100 classi

SVHN10 classi

Clinical Imaging

Chest X-Ray2 classi

ISIC Skin Lesion9 classi

Brain Tumor4 classi

Brain Tumor MRI4 classi

Retinopathy5 classi

Skin Cancer2 classi

Stack Tecnologico

BackendPython, Flask, TensorFlow / Keras

FrontendReact, Chart.js, react-simple-maps

FL FrameworkFedAvg, FedProx, SCAFFOLD, FedNova

Data ProcessingNumPy, Scikit-learn, Pillow

VisualizationChart.js (metrics), D3.js (geo maps)

CommunicationREST API, JSON, YAML configuration

Algoritmi di Federated Learning

Algoritmo Descrizione Ambito consigliato Riferimento

Avg FedAvg

Media pesata dei pesi per numero di campioni. Algoritmo base del Federated Learning, semplice ed efficace con dati IID. Benchmark, dati IID, baseline di confronto McMahan et al., 2017

Prx FedProx

Aggiunge un termine prossimale alla loss locale per vincolare i pesi vicino al modello globale, migliorando la convergenza in ambienti eterogenei. Dati non-IID, nodi eterogenei Li et al., 2020

SCA SCAFFOLD

Utilizza control variates (server/client) per correggere il drift dei gradienti locali, riducendo la varianza su dati non-IID. Forte non-IID, molti client, EHDS Karimireddy et al., 2020

Nov FedNova

Normalizza i contributi per il numero di gradient steps locali, eliminando il bias da epoche e dataset size diversi tra nodi. Nodi con risorse disomogenee, scenari globali Wang et al., 2020

ExP FedExP

Estrapolazione lato server: calcola dinamicamente lo step size ottimale dai pseudo-gradienti dei client, accelerando la convergenza senza overhead. Communication-efficient, fast convergence Jhunjhunwala et al., ICLR 2023

Dyn FedDyn

Regolarizzazione dinamica: aggiorna il regolarizzatore ad ogni round per allineare gli ottimi locali con la loss globale, con convergenza più rapida. Large-scale, convergenza rapida Acar et al., ICLR 2021

▶ Algoritmi avanzati (6 algoritmi — 2021–2025)

MON MOON

Contrastive learning a livello di modello: massimizza l'accordo tra rappresentazioni locali e globali, correggendo il drift locale su dati non-IID. Image classification, non-IID visivo Li et al., CVPR 2021

Dis FedDisco

Pesi di aggregazione basati sulla discrepanza tra distribuzione locale e globale delle categorie, con garanzie teoriche più strette. Non-IID severo, label imbalance Ye et al., ICML 2023

Spd FedSpeed

Correzione del prox-term sugli aggiornamenti locali per ridurre il bias introdotto dalla regolarizzazione, con bound di convergenza più stretto. Eterogeneità elevata, pochi round Sun et al., ICLR 2023

LPA FedLPA

Aggregazione one-shot con posterior bayesiano layer-wise: un singolo round di comunicazione sfruttando la struttura a livelli della rete neurale. One-shot FL, privacy estrema NeurIPS 2024

AFL DeepAFL

Analytic FL gradient-free: usa soluzioni analitiche (least squares) su feature estratte da modelli pre-trained, invariante al grado di non-IID dei dati. Non-IID estremo, robustezza Zhai et al., ICLR 2025

EL FedEL

Elastic learning con selezione dinamica dei tensori rilevanti per round e budget di comunicazione adattivo, bilanciando accuratezza ed efficienza. Device eterogenei, edge computing NeurIPS 2025

Scenari Multi-Scala

La piattaforma include tre Use Case preconfigurati a scale geografiche crescenti, ciascuno ispirato a scenari clinici reali con diversi livelli di eterogeneità infrastrutturale, distribuzione dei dati e vincoli di comunicazione.

Nazionale

Italia

Rete di ospedali di montagna italiani per la detection di polmonite pediatrica. Simulazione di nodi con risorse limitate e connettività variabile.

Chest X-Ray 10 nodi 100 rounds

Europeo

EHDS

Classificazione di lesioni cutanee distribuita su 12 centri in Europa nel framework EHDS. Eterogeneità tra grandi ospedali universitari e cliniche specializzate.

Skin Cancer 12 nodi 150 rounds

Globale

WHO

Rilevamento della tubercolosi coordinato dall'OMS su 15 centri in 6 continenti. Massima eterogeneità computazionale e partecipazione intermittente.

Chest X-Ray 15 nodi 200 rounds