Impiego del clustering statistico per l'individuazione dei modelli di business

BIS Quarterly Review  |  December 2014  | 
07 dicembre 2014

(Riquadro pubblicato alla pagina 3 del capitolo "I modelli di business delle banche",  Rassegna trimestrale BRI, dicembre 2014)

Questo riquadro definisce più precisamente le variabili utilizzate come input e approfondisce gli aspetti tecnici della procedura di classificazione statistica (clustering).

Le otto variabili input da cui vengono ricavate le caratteristiche fondamentali dei modelli di business sono equamente ripartite fra il lato dell'attivo e quello del passivo del bilancio. Tutti gli indici sono espressi come quota sul totale dell'attivo al netto delle posizioni in derivati, e ciò al fine di evitare distorsioni di misurazione dovute alle differenze fra i principi contabili applicabili nelle diverse giurisdizioni. Gli indici dal lato dell'attivo si riferiscono a: a) i prestiti totali; b) i titoli (misurati come somma delle attività e passività di negoziazione al netto dei derivati); c) le dimensioni del portafoglio di negoziazione (misurato come somma dei titoli detenuti a fini di negoziazione e dei titoli al fair value nel conto economico); e d) l'attività di prestito interbancario, misurata come somma dei prestiti e delle anticipazioni a banche, dei pronti contro termine attivi e delle garanzie in contanti). Gli indici dal lato del passivo si riferiscono a: a) i depositi della clientela; b) il debito all'ingrosso (misurato come somma di altri depositi, indebitamento a breve termine e provvista a lungo termine); c) la provvista stabile (misurata come somma dei depositi totali della clientela e della provvista a lungo termine); e d) l'indebitamento interbancario (misurato come depositi da banche, più pronti contro termine passivi e garanzie in contanti).

Viene utilizzato l'algoritmo di classificazione statistica proposto da Ward (1963), che consiste in un metodo di classificazione gerarchica applicabile all'universo di osservazioni individuali (in questo caso, alle coppie banca/anno). Ciascuna osservazione è descritta in termini di una serie di punteggi (in questo caso, gli indici di bilancio). Si tratta di un algoritmo agglomerativo che parte dalle singole osservazioni per costruire dei gruppi (cluster) mettendo insieme le osservazioni più vicine. Procede formando gruppi progressivamente più ampi (ossia ripartendo l'universo di osservazioni in modo più grossolano), massimizzando le analogie fra coppie di osservazioni all'interno di uno stesso gruppo e massimizzando le differenze fra gruppi. L'algoritmo misura la distanza fra due osservazioni come somma delle differenze al quadrato fra i loro punteggi. I risultati della classificazione gerarchica potrebbero essere graficamente rappresentati come le radici di un albero, dove le singole osservazioni costituiscono automaticamente i gruppi più omogenei alla base della gerarchia. L'algoritmo dapprima raggruppa le singole osservazioni in base alla prossimità dei relativi punteggi. I piccoli gruppi così formati sono in seguito combinati fra loro, ottenendo un numero via via inferiore di gruppi sempre più grandi ai livelli più alti della gerarchia, fino ad arrivare a un universo costituito da un solo gruppo all'apice.

Quale ripartizione (ossia livello della gerarchia) rappresenta un buon compromesso fra l'omogeneità all'interno di ciascun gruppo e il numero di gruppi? Non esistono regole fisse per rispondere a questa domanda. Nel presente studio viene utilizzato l'indice pseudo F proposto da Calinśki e Harabasz (1974), che permette di combinare il concetto di parsimonia (ossia un numero ristretto di gruppi) con la possibilità di discriminare (ossia gruppi con caratteristiche sufficientemente distinte tra loro). Il valore dell'indice aumenta quando le osservazioni sono più simili all'interno di un gruppo (presentano cioè punteggi più vicini) e più distinte fra gruppi diversi, e diminuisce all'aumentare del numero di gruppi. La prossimità delle osservazioni è misurata dal rapporto fra la distanza media fra le coppie banca/anno appartenenti a gruppi diversi e la corrispondente media per le osservazioni appartenenti a uno stesso gruppo. Il numero dei gruppi è penalizzato sulla base del rapporto fra il numero totale di osservazioni e il numero di gruppi in una partizione specifica. Il criterio è simile nello spirito ai criteri di informazione di Akaike e Schwarz, spesso utilizzati per scegliere il numero appropriato di lag nelle regressioni delle serie temporali.

L'algoritmo di agglomerazione viene applicato a tutte le combinazioni fra almeno tre variabili di scelta delle otto considerate. Se fosse stato applicato a tutte le loro possibili combinazioni, i calcoli sarebbero stati 325. Questo numero è ridotto tralasciando i sottoinsiemi che includono due variabili di scelta altamente correlate, poiché la compresenza di queste variabili non fornisce informazioni addizionali di rilievo. Viene fissata una soglia del 60% (in termini assoluti) per il coefficiente di correlazione, il che significa che non vengono esaminati gli insiemi di variabili input comprendenti simultaneamente le variabili relative ai titoli e al portafoglio di negoziazione o le variabili relative al debito all'ingrosso e alla provvista stabile.