Alta affidabilità multi-datacenter

Due datacenter indipendenti. Dati replicati. Traffico bilanciato e failover in tempo reale.

Progettiamo e gestiamo infrastrutture web ad alta affidabilità su due datacenter geograficamente separati. Nessun vincolo di vendor, nessun lock-in: le due sedi possono essere in Europa, su continenti diversi o presso operatori distinti. Il sito resta operativo anche quando un'intera sede cade.

Il problema reale

Un solo datacenter basta finché non basta più.

Singolo provider, singola sede, singola rete. Quando qualcosa cede, cede tutto. L'alta affidabilità non è una feature tecnica, è la scelta di non dipendere mai da un unico punto di rottura.

Un'ora di downtime significa ordini e-commerce persi, utenti frustrati, brand danneggiato

Il cliente business ha firmato SLA che non puoi rispettare con un solo datacenter

Lanci stagionali, Black Friday o eventi dove il sito non può assolutamente fermarsi

Provider unico, singolo datacenter, singolo punto di rottura che nessuno ha mai stress-testato

Backup esistenti ma tempi di ripristino di ore dopo un incidente grave

Dipendenza da un solo vendor cloud che aumenta prezzi o cambia condizioni a sorpresa

Cosa costruiamo

Sei pilastri di un'infrastruttura che resta in piedi.

Non è una checklist di tecnologie. È l'insieme minimo che deve essere presente, testato e gestito perché il sito stia su quando uno dei due datacenter smette di rispondere.

Due datacenter indipendenti

Le due sedi sono su provider e reti diverse. Nessun singolo punto di fallimento tra di loro: elettricità, connettività, gestione e fornitore sono separati per costruzione.

Dati replicati in continuo

File e database sincronizzati tra le due sedi. Quando serve, replica sincrona con perdita zero. Quando ha senso, replica asincrona con RPO di secondi.

Load balancing reale

Il traffico si distribuisce sulle due sedi, non stagna su una sola. Controlli di salute attivi a livello TCP e applicativo, con session affinity dove la logica lo richiede.

Failover automatico

Se una sede cade, il traffico viene deviato sull'altra in tempi misurati in secondi o decine di secondi. Niente intervento manuale notturno, niente chiamate urgenti al sistemista.

Esercitazioni di failover

La continuità si dimostra, non si dichiara. Test programmati: stacchiamo una sede, il sito resta online, documentiamo i tempi. Se non passa la prova, il sistema non è pronto.

Vendor indipendenza

Non siamo sposati con nessun hyperscaler. Usiamo il provider che ha senso per il tuo carico, i tuoi utenti, il tuo budget. Puoi cambiare sede o vendor senza riscrivere tutto.

Qualsiasi vendor, qualsiasi continente

Le due sedi le scegli tu, con noi che ti guidiamo.

Abbiamo la possibilità di attivare datacenter in Europa, Nord America, Asia, Sud America, ovunque serva. Nessuna fedeltà cieca a un provider: l'architettura viene prima della marca.

Scenario

Due sedi europee

Latenza bassa verso utenti italiani ed europei. Usato quando il mercato è concentrato in UE e la priorità è continuità più che distanza geografica estrema.

Scenario

Europa + Nord America

Copertura su due continenti, utile per SaaS con utenti globali o per aziende che vogliono un secondo piede operativo fuori dall'area di rischio principale.

Scenario

Europa + Asia

Rotta scelta quando c'è un mercato asiatico rilevante o quando serve distanza massima dalla sede primaria per scenari di continuità estremi.

Scenario

Stessa area, provider diversi

Due datacenter vicini ma su operatori e reti indipendenti. Ottimo compromesso tra latenza minima e protezione da guasti di un singolo vendor o carrier.

Come decidiamo l'architettura

Prima di scegliere tecnologie, scegliamo obiettivi.

L'errore più comune in alta affidabilità è partire dalle tecnologie (Galera, DRBD, Anycast, ecc.) e adattarci il business. Noi facciamo l'inverso.

  1. 01

    Quanto costa un'ora di downtime?

    Partiamo da qui. Se un'ora giù significa decine di migliaia di euro persi, il design è uno. Se significa disagio gestibile, un altro. I numeri guidano l'architettura, non le mode.

  2. 02

    Active/active o active/passive?

    Active/active se il carico va davvero distribuito sulle due sedi. Active/passive se serve una sede calda pronta a prendere il traffico senza doverla svegliare. Scegliamo con criterio tecnico, non ideologico.

  3. 03

    Sincrono o asincrono?

    Replica sincrona per dati dove la perdita di un singolo record è inaccettabile. Replica asincrona dove qualche secondo di ritardo è accettabile e la latenza globale conta di più. Dipende dal business, non dal manuale.

  4. 04

    Quanto tempo di failover è accettabile?

    Secondi, decine di secondi, minuti? Ogni target richiede un disegno diverso di DNS, load balancer e health check. Dichiariamo il numero nero su bianco e lo misuriamo a ogni prova.

Dati allineati

Replica file e database in continuo tra le due sedi. Il failover trova dati coerenti, non relitti da ricostruire.

Traffico gestito

Load balancer con health check attivi su entrambe le sedi. Ogni richiesta va dove c'è un backend vivo, non dove capita.

Failover provato

Esercitazioni periodiche con tempi misurati. Niente promesse teoriche, numeri veri sul runbook.

Domande frequenti

Le domande più comuni quando un business valuta multi-datacenter.

Sì, quando il costo del downtime supera il costo dell'architettura. Un e-commerce che fattura 50k al mese perde migliaia di euro in ogni ora di fermo. Per queste realtà l'alta affidabilità non è lusso, è protezione del fatturato.

Quasi mai. La maggior parte dei siti e applicazioni esistenti si porta in multi-datacenter senza riscrittura. Serve un assessment del modello dati, delle sessioni utente e di eventuali dipendenze locali. Se c'è qualcosa che va adattato, te lo diciamo prima, non dopo.

No. La scelta dipende da caso d'uso, utenti finali, budget e profilo di rischio. Lavoriamo con cloud europei, hyperscaler globali, operatori bare-metal di qualità, provider specializzati. L'obiettivo è dare al cliente la combinazione giusta, non vendergli una marca.

La sede primaria rientra in modo controllato, non automatico e imprevedibile. I dati scritti sulla sede di failover vengono risincronizzati, gli health check la riconoscono pronta, il traffico torna a essere bilanciato secondo il modello scelto. Ogni ritorno è una procedura pianificata.

Sì. Spesso si parte con una sede operativa e una sede calda in active/passive, si stabilizza, si eseguono test di failover, poi si valuta il passaggio ad active/active quando il carico e la maturità operativa lo giustificano.

Architettura documentata, runbook di failover scritti, report dei test eseguiti con tempi reali, un Disaster Recovery Plan con RTO e RPO misurati e un canale di gestione continuativa. Non è un PDF e via, è un sistema operativo e supportato.

Alta affidabilità reale

Quando un'ora di downtime costa troppo, smetti di affidarti a un solo datacenter.

Assessment scritto, architettura proposta con RTO e RPO espliciti, vendor scelti insieme senza lock-in. Iniziamo dal numero che ti fa male: quanto perdi se il sito cade un'ora.