Ein Backup gehört zu den wichtigsten Dingen, die ein IT-System braucht.
Backups müssen
- automatisch erstellt werden
- verlässlich zurückspielbar sein
- verschlüsselt sein, insbesondere bei Offsite-Backups.
- Inkrementell arbeiten
rsync
Vor Jahren hatte ich ein Backup mit rsync aufgebaut, mit dem ich prinzipiell sehr zufrieden war.
rsync hat einige Vorteile:
- Es ist schnell. 500 GB Daten sind in ca. 3 Minuten synchronisiert, bei herkömmlichen Festplatten.
- Es ist verlässlich. Zum Lesen der Daten braucht man keine Werkzeuge, sondern ein einfaches Zurückkopieren reicht.
- Übertragungen über SSH sind kein Problem
Mit der Zeit haben sich folgende Nachteile ergeben
- Verschobene/umbenannte Dateien verbauchen den Speicherplatz nochmals. Das Umbenennen von 'movies' in 'filme' kann den Backupspeicher platzen lassen...
- Eine Verschlüsselung muss zugebaut weren
- Zeitbasiertes Aufräumen benötigt zusätzliche Werkzeuge wie rsnapshot, backintime.
- keine Prüfsummen
Also ging ich auf die Suche nach einem anderen Backup-Tool...
git
Ja, mit git kann man Backups erzeugen. Das größte Problem ist die Behandlung von Binärdateien. Jede neue Version benötigt im git objekt-store Speicherplatz, womit nichts gewonnen wäre.
git ist ein großartiges Tool für Sourcecode, aber für Backups scheint es das falsche zu sein...
Also ging ich auf die Suche nach einem anderen Backup-Tool...
borg
borg scheint genau das Tool der Wahl zu sein. Borg zerlegt alle Nutzdaten in Chunks. Dateien mit gleichem Inhalt verbrauchen also nur einmal Speicherplatz im Backup-Repository, das nennt man "Deduplizierung".
- Umbenennen und Verschieben von Dateien ist problemlos möglich, ohne das erneut Speicherplatz verbraucht wird.
- borg kann das Backup-Repository verschlüsseln
- Übertragung über SSH ist kein Problem
- Eine Aufräumfunktion ist enthalten
- Integritätsprüfung der Backups über Prüfsummen
Ganz perfekt ist es prinzipbedingt auch nicht, denn
- Für das Zurücksichern ist borg notwendig. Allerdings ist das kein großes Problem, weil neuere Versionen von borg ältere Repositories lesen können.
- Off-Site-Backups sind schwierig
- Verschieben von Datenverzeichnis oder Repository führt meist zu einer langwierigen Neuindizierung
Trotzdem ist borg mein neues Backuptool der Wahl. Insbesondere dank der Deduplizierung kann ich meine Daten nun beliebig umstrukturieren, ohne dass das Backup aus allen Nähten platzt.