wiki:Server/Backup

Backups bei PhysikOnline

Foto eines roboterbetriebenen Bandlaufwerksystems, wie es vom HRZ genutzt wird. Das Foto zeigt ein ähnliches System vom Hochleistungsrechenzentrum Stuttgart, fotografiert von Sven

Roboter, die petabytegroße Bandlaufwerke steuern, sichern das wissenschaftliche Erbe an der Goethe-Universität

Diese Seite soll eine Übersicht über die Backup-Strategien bei PhysikOnline geben. Diese lässt sich auf eine einfache Formel zurückführen: Im Hintergrund wird immer der Backup- und Archivdienst des Hochschulrechenzentrums in Anspruch genommen. Das bedeutet, dass Dateien ständig auf in eine von Robotern gesteuerte Bandlaufwerksbibliothek gesichert werden, die sich im PA-Gebäude auf dem Campus Westend (ehemals Juridicum Campus Bockenheim) befindet. Dieses Backuparchiv wird zusätzlich zu einem baugleichen System an der TU-Darmstadt gespiegelt. Im Falle einer nuklearen Katastrophe mittleren Ausmaßes über Frankfurt wären die eLearning-Daten der Physik also gesichert.

Das eLearning-Projekt des Fachbereiches sichert gebackupte Daten im Umfang von etwa 10-20 Terabyte. Es gibt drei Sicherungskopien, die 90 Tage lang aufgehoben werden.

Da wir sowohl Dienste des ITPs in Anspruch nehmen als auch eigene Rechner betreiben (etwa die elearning-VM oder die POKAL-CLOUD), ist unsere Backup-Strategie ebenfalls heterogen.

Backup von ITP-Laufwerken

Alle Inhalte in unseren ITP-Heimaccounts sind komplett gebackupt, dies wird seitens des Instituts sichergestellt. Es gibt auch Speicherplatz im Institut, der nicht gebackupt ist, das ist das ca. 10TB große Scratch-Verzeichnis /home/work-itp. In diesem haben wir einige Arbeitsdateien gespeichert, die nicht wichtig sind.

Das hübsche an den ITP-Heimaccounts ist, dass wir uns um den Backupmechanismus keine Sorgen machen müssen. Er funktioniert einfach.

Backup von eigenen Servern

Unsere eigenen Rechner sind mit 500GB bis 2TB großen Festplatten ausgestattet, insgesamt kommen wir etwa auf 5-10 TB eigene Festplattenkapazitäten. Die Notwendigkeit, diese Rechner zu backupen, ergab sich bereits 2012, als POKAL in den Produktivbetrieb ging. Aber erst Ende 2015 haben wir uns wirklich mit dem Thema Backups auseinandergesetzt. Dabei kommt die Tivoli Storage Manager-Software zum Einsatz. Erste Diskussionen zu Backups wurden in #398 und #552 angesprochen.

Anfang 2016 wurde TSM für RiedbergTV erstmals installiert, siehe dazu das Hauptticket #1205 sowie #1262 für Zugangsdaten.

Falsch verstandene Backups

Früher haben wir die elearning-VM gebackupt, in dem wir täglich einen kompletten Festplattenabzug als Tarball in ein gebackuptes ITP-Volume kopiert haben. Dies hat jeden Tag mehrere Stunden gedauert, und Tickets wie #1027 zeugen von diesem Vorgang. Solche Methoden wurden auch bei POKAL1 angewandt. Mit einer effizienten Backup-Strategie hast das aber nichts zu tun. Was passiert ist, ist, dass uns regelmäßig die Zielfestplatte mit nutzlosen Sicherungskopien der auf diese Weise gebackupten Festplatte vollgeschrieben wurde und wir alte Sicherungskopien immer wieder manuell löschen mussten.

Last modified 21 months ago Last modified on Jan 5, 2016 8:52:30 PM

Attachments (1)

  • Bandlaufwerke.jpg (313.1 KB) - added by sven 21 months ago. Foto eines roboterbetriebenen Bandlaufwerksystems, wie es vom HRZ genutzt wird. Das Foto zeigt ein ähnliches System vom Hochleistungsrechenzentrum Stuttgart, fotografiert von Sven

Download all attachments as: .zip