Was ist Disaster Recovery?
Disaster Recovery (DR) bezeichnet die Gesamtheit aller dokumentierten Verfahren, technischen Fähigkeiten und organisatorischen Maßnahmen, mit denen Unternehmen nach einem Störfall ihre IT-Infrastruktur und IT-Services wiederherstellen. Ziel ist es, kritische Geschäftsprozesse innerhalb definierter Recovery Time Objectives (RTO) und Recovery Point Objectives (RPO) wieder aufnehmen zu können.
Im Fokus stehen dabei insbesondere:
- Rechen- und Serverinfrastrukturen
- Speicher- und Backup-Systeme
- Netzwerke und Standorte
- Applikationen und IT-Services
Ein professioneller Disaster-Recovery-Plan beschreibt detailliert, wie diese Komponenten im Katastrophenfall wiederhergestellt werden – nachvollziehbar, testbar und ausführbar.
Disaster-Recovery-Strategie vs. Disaster-Recovery-Plan
Eine erfolgreiche Disaster Recovery basiert auf zwei klar getrennten, aber eng verbundenen Ebenen:
Die Disaster-Recovery-Strategie
Die DR-Strategie definiert den übergeordneten Rahmen und beantwortet zentrale Fragen:
- Welche Geschäftsprozesse und IT-Systeme sind kritisch?
- Welche Risiken und Bedrohungsszenarien bestehen?
- Welche Wiederherstellungsziele (RTO/RPO) müssen erreicht werden?
- Welche Wiederherstellungsmodelle und Technologien sind geeignet?
- Wie hoch ist die angestrebte Wiederherstellungsbereitschaft?
Die Strategie gibt also vor, was erreicht werden soll und warum.
Der Disaster-Recovery-Plan
Der DR-Plan setzt die Strategie operativ um. Er übersetzt strategische Vorgaben in konkrete Inhalte wie:
- Prozesse und Ablaufpläne
- Rollen, Verantwortlichkeiten und Eskalationswege
- Technische Wiederherstellungsschritte
- Abhängigkeiten zwischen Systemen
- Kommunikations- und Freigabeprozesse
Im Krisenfall funktioniert nur ein DR-Plan, der eindeutig strukturiert, aktuell und für alle Beteiligten verständlich ist.
Typische Disaster-Recovery-Ansätze und Betriebsmodelle
Disaster Recovery konzentriert sich in der Regel auf Infrastruktur-Ausfälle, bei denen davon ausgegangen wird, dass Daten grundsätzlich intakt und wiederherstellbar sind. Je nach Schutzbedarf und Budget kommen unterschiedliche Modelle zum Einsatz, die als Risiko-Management-Strategien gelten:
Standby-Modelle
- Cold Standby: minimale Kosten, lange Wiederanlaufzeiten
- Warm Standby: ausgewogenes Verhältnis zwischen Kosten und Verfügbarkeit
- Hot Standby: hohe Kosten, sehr kurze Wiederherstellungszeiten
- Active/Active: maximale Verfügbarkeit durch parallelen Betrieb
Betriebsumgebungen
- On-Premises
- Public oder Private Cloud
- Disaster Recovery as a Service (DRaaS)
- Resiliente Cloud-native Anwendungsarchitekturen
Die Wahl des Modells sollte immer an den geschäftlichen Anforderungen und den Ergebnissen der BIA ausgerichtet sein.
Die Phasen des Krisenmanagements im Disaster-Recovery-Kontext
In der Praxis wird der Krisenmanagement- und Wiederherstellungsprozess häufig als Lebenszyklus mit klar definierten Phasen beschrieben. Studien und Frameworks – unter anderem von Gartner – unterscheiden dabei verschiedene Ausprägungen. Bewährt hat sich eine Einteilung in vier zentrale Phasen, die Vorbereitung, Reaktion, Wiederherstellung und Nachbereitung abdecken.
1. Vorbereitung und Bereitschaft (Preparation & Readiness)
In dieser Phase werden die organisatorischen, fachlichen und technischen Grundlagen für den Ernstfall geschaffen. Ziel ist es, handlungsfähig zu sein, bevor eine Störung eintritt.
Typische Inhalte dieser Phase sind:
- Definition von Governance, Geltungsbereich und Zielen
- Durchführung der Business Impact Analysis (BIA)
- Festlegung von RTO- und RPO-Zielen
- Definition von Rollen, Verantwortlichkeiten und Eskalationswegen
- Entwicklung der Disaster-Recovery-Strategie
- Erstellung von Runbooks, Kommunikations- und Übungsplänen
- Auswahl und Einsatz geeigneter Tools
Moderne Organisationen integrieren bereits in dieser Phase KI-gestützte Analysen, um Abhängigkeiten, Risiken und Wiederherstellungsprioritäten besser zu erkennen und die DR-Dokumentation konsistent zu halten.
2. Erkennung, Bewertung und Aktivierung (Detection & Activation)
Sobald eine Störung oder ein Vorfall auftritt, beginnt die operative Krisenphase. Im Fokus stehen eine schnelle Einschätzung und die richtige Eskalationsentscheidung.
Zentrale Aktivitäten sind:
- Identifikation und Klassifizierung des Vorfalls
- Erste Impact-Bewertung
- Entscheidung über die Ausrufung eines Desasters bzw. die Aktivierung des Krisenmanagements
- Aktivierung der DR- und Krisen-Playbooks
- Information interner und externer Stakeholder gemäß Kommunikationsplan
Ein klar definierter Aktivierungsprozess verhindert Verzögerungen und reduziert Fehlentscheidungen in der kritischen Anfangsphase.
3. Reaktion und Wiederherstellung (Response & Recovery)
Diese Phase bildet den Kern des Disaster Recovery und des operativen Krisenmanagements. Ziel ist es, den Schaden zu begrenzen und priorisierte Services wiederherzustellen.
Dazu gehören:
- Eindämmung des Vorfalls
- Durchführung der technischen Wiederherstellungsmaßnahmen
- Abarbeitung der Runbooks in definierter Reihenfolge (z. B. beginnend mit Tier-0- bzw. Kernservices)
- Validierung der wiederhergestellten Systeme mit den jeweiligen Geschäftsverantwortlichen
- Koordination aller beteiligten Funktionen (IT, Informationssicherheit, BCM, Recht, Kommunikation)
- Das Krisenmanagementteam steuert Eskalationen, trifft Entscheidungen und stellt sicher, dass Wiederherstellungsmaßnahmen an den geschäftlichen Prioritäten ausgerichtet bleiben.
4. Rückkehr zum Normalbetrieb und Nachbereitung (Post-Incident & Improvement)
Nach der technischen Wiederherstellung folgt eine oft unterschätzte, aber entscheidende Phase: die nachhaltige Stabilisierung und Verbesserung.
Typische Schritte sind:
- Failback und Wiederherstellung der regulären Produktionsumgebung
- Durchführung von Post-Incident-Reviews und Lessons Learned
- Aktualisierung von DR- und BCM-Dokumentationen
- Anpassung von Strategien, Runbooks und Roadmaps
- Kommunikation der Ergebnisse an Stakeholder und Management
Nur durch diese systematische Nachbereitung bleibt das Disaster-Recovery-Programm langfristig wirksam und entwickelt sich kontinuierlich weiter.
Risikomanagement-Strategien im Kontext von DR, BCM und GRC
Ein wirksames Risikomanagement ist kein einmaliges Projekt, sondern ein kontinuierliches Programm, das Planung, Absicherung und Überwachung miteinander verbindet. Führende Frameworks – u. a. nach Gartner – beschreiben Risikomanagement als lebenszyklusorientierten Ansatz, der datenbasiert, kontextbezogen und eng an den Geschäftszielen ausgerichtet ist.

Risikomanagement ist ein kontinuierlicher, geschäftsorientierter Prozess, der Planung, Absicherung und Überwachung miteinander verbindet. Ziel ist es, Risiken im Kontext der Geschäftsprozesse zu verstehen, zu bewerten und priorisiert zu behandeln – auf Basis von BIA-Ergebnissen, klaren Kritikalitätsstufen und geeigneten Bewertungsmethoden. Wirksame Risikomanagement-Strategien kombinieren qualitative und quantitative Analysen, setzen gezielt Kontrollen aus etablierten Frameworks ein, steuern Investitionen und technische Schulden bewusst und verankern klare Verantwortlichkeiten. Durch kontinuierliches Monitoring, verständliche Kommunikation in Business-Terminologie und die enge Verzahnung mit Disaster Recovery und Business Continuity Management entsteht ein belastbares, steuerbares und dauerhaft wirksames Risikoprogramm.
Disaster Recovery als Bestandteil von BCM und BCP
Disaster Recovery ist kein isoliertes IT-Thema, sondern ein integraler Bestandteil eines ganzheitlichen Business Continuity Managements (BCM) bzw. Business Continuity Planning (BCP).
Eine wirksame DR-Planung:
- basiert auf den Ergebnissen der Business Impact Analysis (BIA)
- orientiert sich an definierten Wiederherstellungsstufen
- priorisiert Systeme anhand ihrer Bedeutung für kritische Geschäftsprozesse
- stellt sicher, dass IT-Wiederherstellung die geschäftlichen Lebensadern unterstützt
So wird gewährleistet, dass technische Wiederherstellung nicht losgelöst von den Business-Anforderungen erfolgt.
Disaster Recovery vs. Ransomware- & Cyber-Recovery
in wichtiger Punkt in der modernen Resilienzplanung ist die klare Trennung zwischen klassischer Disaster Recovery und Cyber-/Ransomware-Recovery.
Während DR primär auf Infrastruktur-Failover und Wiederanlauf abzielt, erfordert die Wiederherstellung nach Cyberangriffen häufig zusätzliche Schritte:
- forensische Analysen
- Bereinigung und Validierung von Backups
- isolierte Wiederherstellungsumgebungen
- Neuaufbau kompromittierter Systeme
Diese Szenarien gehen deutlich über traditionelle DR hinaus und benötigen separate, spezialisierte Prozesse.
Lese-Tipp: In unserem Blog erläutern wir die Abgrenzung zwischen Disaster Recovery (DR) und BCM und vergleichen geeignete BCM-Tools.



