Il backup dei dati è la prima forma di protezione per non perderli. D’altronde, se è vero che i dati (e quindi le informazioni) sono il petrolio del nuovo millennio, si evince automaticamente che la loro protezione è una priorità dettata dal buon senso prima ancora che dalle leggi.
Non a caso, proprio al backup dei dati è dedicata la giornata mondiale del World Backup Day che ogni anno, il 31 marzo, ci ricorda l’importanza delle copie di sicurezza dei dati per garantire la normale continuità operativa alle aziende in caso di incidenti informatici o di altra natura.
Inoltre il backup dei dati può anche essere considerato come uno dei tre pilastri della strategia di sicurezza dei dati aziendali. Gli altri due pilastri sono Disaster Recovery e Business Continuity.
Indice degli argomenti
Che cosa si intende con backup dei dati: le strategie
Esistono diverse soluzioni per il backup dei dati aziendali, ognuna con i suoi vantaggi e svantaggi. La scelta della soluzione più adatta dipende da diversi fattori, tra cui:
Dimensione delle aziende
- piccole aziende: possono utilizzare soluzioni semplici come backup su disco rigido esterno o su cloud.
- medie e grandi aziende: necessitano di soluzioni più robuste e scalabili, come sistemi di backup on-premise o soluzioni cloud enterprise.
Tipologia di dati
- Dati sensibili: richiedono un livello di sicurezza più elevato, con crittografia e autenticazione a due fattori.
- Dati non sensibili: possono essere conservati su supporti meno sicuri, come dischi rigidi esterni.
Budget
- Soluzioni gratuite: sono disponibili diverse soluzioni gratuite, ma spesso offrono funzionalità limitate.
- Soluzioni a pagamento: offrono maggiore flessibilità, scalabilità e sicurezza.
Alcune delle soluzioni più comuni per il backup dei dati aziendali includono
Backup su disco rigido esterno
- Vantaggi: Economico, facile da usare, offre un accesso rapido ai dati.
- Svantaggi: Capacità di archiviazione limitata, vulnerabile a danni fisici o furto.
Backup su cloud
- Vantaggi: Scalabile, sicuro, accessibile da qualsiasi luogo.
- Svantaggi: Può essere costoso, richiede una connessione Internet affidabile.
Sistemi di backup on-premise
- Vantaggi: offrono un controllo completo sui dati, elevata sicurezza.
- Svantaggi: possono essere costosi e complessi da gestire.
Soluzioni di disaster recovery
- Vantaggi: consentono di ripristinare i dati rapidamente in caso di disastro informatico.
- Svantaggi: possono essere molto costose.
La regola del 3-2-1 per il backup dei dati
Oltre a queste soluzioni, è importante implementare una regola del 3-2-1 per il backup dei dati:
- copie: Avere almeno 3 copie dei dati.
- supporti: Conservare i dati su 2 supporti diversi.
- off-site: Conservare 1 copia dei dati fuori sede.
A cosa serve il backup dei dati in azienda
Esistono molteplici minacce alla conservazione dei dati, alcune delle quali provengono da fattori esterni, ma molte anche da fattori interni o insiti nei sistemi che si usano. Tuttavia, le piccole e piccolissime realtà professionali (professionisti, studi, associazioni, piccole aziende) spesso sottovalutano questo aspetto, probabilmente grazie ad una falsa sicurezza dettata dalle piccole dimensioni dei propri sistemi e dallo scarso valore (presunto) dei propri dati, nonché per la mancanza di conoscenze e di strumenti economicamente abbordabili.
Eppure, trovare modalità di salvaguardia dei propri dati è possibile anche utilizzando strumenti hardware e software dai costi contenuti. Lo scopo dei suggerimenti seguenti è quello di fare in modo che anche le piccole realtà si possano dotare di un sistema di backup efficiente, cioè che minimizzi perdite di dati e tempi di ripristino dell’operatività.
Come organizzare i dati per il backup
Per poter rendere il più semplice possibile la gestione dei backup, è necessario organizzare le informazioni opportunamente. Il metodo più semplice è quello di definire l’attualità del dato, in modo da poterne poi differenziare il tipo di backup:
- dati attivi, cioè usati e/o modificati attualmente o recentemente;
- dati inattivi usati o modificati in un passato abbastanza lontano;
- dati inutili il cui impatto per l’eventuale perdita è nullo.
Questi ultimi sono i più difficili da individuare: la tendenza che prevale è quella di pensare che tutti i dati potrebbero servire di nuovo, prima o poi; ma nella realtà, spesso sono la maggioranza.
Questo tipo di categorizzazione può anche essere applicata ad un singolo file, ma è molto più semplice applicarlo a cartelle o strutture di cartelle, il che però presuppone un’organizzazione logica di esse fatta a monte. Se da una parte non esistono regole generali, è anche vero che alcuni esempi di situazioni comuni possono risultare utili:
- documenti vari: suddividere per categoria o tipologia (se sono parecchi, prima per anno);
- posta elettronica: suddividere per anno, poi per altri criteri (es. clienti/fornitori);
- contabilità: suddividere per anno;
- progetti: suddividere per fasi (se sono a durata pluriennale; altrimenti meglio prima raggruppare i progetti per anno);
- database: considerarlo come un’entità unica (a meno che non sia di dimensioni troppo grandi per poter fare backup ripetuti).
La fatica di impostare e mantenere una efficiente organizzazione dei dati sarà senz’altro ripagata quando ci si ritroverà a dover uscire da situazioni difficili.
Qual è il miglior backup
Le modalità dei backup si possono dividere in due grandi categorie:
- quelli che semplicemente creano una copia (replica) dei file “da un’altra parte”, spesso mantenendo anche la struttura delle cartelle;
- quelli che impacchettano i file e relativa struttura di cartelle in un singolo grande “archivio”.
Impossibile definire a priori quale sia la categoria migliore: dipende dalle proprie esigenze. Vanno valutati vantaggi e svantaggi, che sono riassunti nella tabella seguente.
Tipologia di backup | Vantaggi | Svantaggi |
Replica dei file |
|
|
Archiviazione |
|
|
A un’analisi frettolosa, sembrerebbe che il rapporto tra vantaggi e svantaggi possa far propendere per il metodo delle repliche, ma in realtà i vantaggi del metodo dell’impacchettamento sono in molti casi insostituibili.
Come fare il backup: replica dei file
Se la tipologia scelta è quella della replica, la sua esecuzione è quanto mai semplice.
È vivamente sconsigliato il metodo “manuale”, cioè utilizzare le funzioni di copia/incolla dei file normalmente disponibili nel sistema operativo (o più propriamente, nel suo File Manager): le probabilità di dimenticarsi qualcosa o, al contrario, copiare qualcosa di indesiderato, sono altissime. Molto meglio affidarsi ad uno strumento che si occupi di mantenere sincronizzati i file tra la locazione principale e la replica.
Esistono tanti tool per il backup anche tra gli open source e tra quelli gratuiti, ma tra questi ne spicca uno dall’efficienza e semplicità disarmante: rsync. Questa utility, che è uno standard nel mondo Unix, è stata ovviamente portata anche nel mondo Windows (sia come programma autonomo, che all’interno dei pacchetti di utility), per cui è sempre possibile averlo a disposizione. Inoltre, almeno nella versione Unix, può effettuare tranquillamente trasferimenti su altri dispositivi via rete senza dover configurare condivisioni di cartelle.
Con un comando base simile a questo:
rsync -ar /sorgente/* /destinazione/
è possibile replicare un’intera struttura di cartelle (quindi, anche un intero disco) sapendo che vengono effettivamente copiati solo i file nuovi o modificati, mentre gli altri sono riconosciuti come uguali e quindi ignorati.
Non solo, nel caso sia stato necessario operare sui file replicati, semplicemente scambiando sorgente e destinazione è possibile risincronizzare le due copie e riprendere a usarle come di consueto.
In realtà, le opzioni disponibili sono tantissime e, se usate opportunamente, possono soddisfare praticamente qualsiasi esigenza. Non è questa la sede di analizzare tutte le possibilità, basta affidarsi ad una delle tante guide disponibili sul web (o, semplicemente, alla main page). Tuttavia, è bene porre l’attenzione su una particolare opzione, potenzialmente pericolosa: quella che causa la cancellazione dei file non presenti nella sorgente anche dalla destinazione; comunque basta valutare con molta attenzione il suo utilizzo o meno.
Infine, basta inserire il comando (una volta validato) nello scheduler del sistema operativo per avere la replica automatica dei file da sottoporre a backup (ovviamente, in questo caso i computer devono rimanere accesi).
Come fare il backup: archiviazione
Se la tipologia di backup scelta è quella di impacchettare tutti i file in un grande archivio (o file di backup) è necessario affidarsi ad un software che se ne occupi. Perché il software sia adeguato, deve avere alcune caratteristiche minime:
- creare l’archivio;
- verificarne la consistenza;
- visualizzarne il contenuto (cioè la lista dei file contenuti);
- estrarre i file (anche singolarmente) dall’archivio.
Ai più attenti non sfuggirà che queste caratteristiche non sono possedute solo dai software specificatamente dedicati ai backup, ma anche dai software che gestiscono la compressione dei file, che infatti possono essere una prima opzione di backup adeguata, ma normalmente necessitano di una gestione più “partecipata” da parte dell’utente finale (o degli amministratori di sistema, nelle organizzazioni che li hanno), intendendo con questo che sarà compito dell’utente nominare opportunamente gli archivi per permetterne il riconoscimento, rimuovere i vecchi archivi ormai inutili e via dicendo.
D’altra parte, i software di backup possiedono ulteriori funzionalità da cui è difficile prescindere, quali quella di avere integrato un pianificatore (scheduler) e quella di tenere traccia del contenuto degli archivi senza doverli aprire, permettendo quindi una facile ricerca dei file (e relative versioni) ed eventualmente effettuandone direttamente il ripristino.
Il problema dei software di backup è che sono normalmente commerciali e anche di un certo costo, a meno di utilizzare i software spesso a corredo dei supporti di memorizzazione (che saranno analizzati nel seguito) e che comunque offrono un buon pacchetto di funzionalità.
Backup: l’importanza del monitoraggio
Di qualunque tipo siano i dati, qualsiasi tipologia di backup si sia scelta e qualsiasi supporto di backup si utilizzi, l’esecuzione dei backup stessi va controllata sempre.
Errore comunissimo è quello di non controllare se non nel momento in cui si ha bisogno del backup, ossia per un ripristino: se il backup non è utilizzabile, è come non averlo fatto, i dati persi lo sono irreversibilmente.
I problemi più comuni nell’esecuzione dei backup sono banali: spazio insufficiente sul supporto, file lasciati aperti, tempi di esecuzione troppo lunghi.
Controllare i backup significa:
- verificare che siano stati completati;
- verificarne la consistenza (ossia completezza ed integrità);
- testare il ripristino.
Le tre attività si possono eseguire con frequenze diverse: tutte le volte che si esegue il backup, la prima; a campione, o meno frequentemente, la seconda; un paio di volte l’anno, la terza. Nonostante sia la meno frequente, la terza è la più importante: il suo scopo non è tanto verificare che il ripristino possa essere completo (che è compito più della seconda), ma che si è preparati a farlo e anche il più velocemente possibile.
Quale supporto di memoria per il backup
Dove memorizzare i backup? I supporti più diffusi sono ovviamente i dischi di un “server”, i dischi rimovibili (sia USB, che ottici), ed in qualche caso anche i nastri. Si possono però fare cose interessanti con due tipi di supporto relativamente recenti: i NAS ed il cloud storage.
Si tratta di fatto dello stesso tipo di supporto di memorizzazione, ma il primo è in rete locale (quindi veloce), mentre il secondo è su rete internet (quindi lento; diciamo che serve almeno un buon collegamento in fibra perché sia utilizzabile efficacemente).
Nel seguito tralasciamo quindi i dischi ottici e i nastri, che hanno fatto il loro tempo, pur conservando la loro utilità in qualche caso. I dischi rimuovibili sarebbero un’ottima opzione, perché molto economici, ma hanno il grande difetto di essere poco affidabili.
Server, NAS e cloud storage sono solo apparentemente diversi: essenzialmente, il NAS è un server dedicato allo storage (mentre il server “tradizionale” ha anche altre funzioni), ed il cloud storage è, come detto, simile ad un NAS remoto.
La caratteristica importante è che mettono a disposizione sulla rete, qualsiasi essa sia, diversi protocolli di condivisione e/o trasferimento (nonché di sicurezza), rendendoli quindi accessibili praticamente in tutte le condizioni.
D’altra parte, condividono anche lo stesso problema: in assenza del collegamento di rete, sono inutili. Assumendo però che le connessioni di rete siano sufficientemente stabili, essi si adattano perfettamente all’uso con gli strumenti software sopra consigliati, nonché all’utilizzo diretto (o al più dopo copia effettuata manualmente) delle repliche in caso di necessità.
Un punto di attenzione: la ridondanza dei dischi all’interno di server e NAS non è sufficiente perché protegge solo dai guasti hardware (il che è comunque utilissimo), mentre è inutile contro gli errori umani e i problemi causati a livello software (per esempio, la corruzione della struttura del file system).
Strategia base di backup per mettere al sicuro i dati
Quella che segue è una strategia di base, basata sui concetti espressi in precedenza, valida nei casi più comuni, ma utile anche solo come punto di partenza per crearne una personalizzata:
- dati attivi: replica giornaliera (in orario serale, più vicino possibile alla fine dell’orario di lavoro) su server/NAS/cloud (o disco rimovibile, se non disponibile il collegamento di rete);
- dati inattivi: archiviazione (completa o incrementale, a seconda delle dimensioni) settimanale o mensile su cloud (o NAS se non disponibile il cloud);
- dati inutili: mantenere solo i file sullo storage principale.
In ogni caso, qualsiasi sia la strategia, è fondamentale avere sempre almeno 2 copie a disposizione. La situazione ideale, qualsiasi sia il valore e la dimensione dei dati, è avere 3 copie: quella principale o di lavoro; quella di riserva locale (cioè, il cui supporto fisico si trova fisicamente nello stesso edificio di quello principale); e quella di riserva remota (detta anche di Disaster Recovery) il cui supporto fisico si deve trovare in un altro edificio più o meno lontano da quello principale (in questa categoria rientra il cloud storage).
Articolo originariamente pubblicato il 29 Ago 2022