Update: Der aktuelle ausblickende Stand zur KRITIS-Verfügbarkeit zeigt, dass die Sicherstellung eines unterbrechungsfreien Betriebs zunehmend durch gesetzliche Vorgaben wie das 2026 in Kraft getretene KRITIS-Dachgesetz sowie durch strengere Resilienzanforderungen an Betreiber geprägt wird. Gleichzeitig rücken ganzheitliche Konzepte mit Redundanzen, sektorübergreifender Vernetzung und kontinuierlichem Risikomanagement stärker in den Fokus, da Ausfälle kritischer Infrastrukturen erhebliche Versorgungsengpässe und Sicherheitsrisiken verursachen können.

21. Juni 2026

Verfügbarkeit ist das A und O Kritischer Infrastrukturen. Ob es um die Stromversorgung, Wasserversorgung, das Gesundheitswesen oder die digitale Kommunikation geht – sie müssen stets zugänglich sein. Eine unterbrochene Versorgung kann innerhalb kürzester Zeit zu weitreichenden Konsequenzen führen, von Unannehmlichkeiten im Alltag bis hin zu schwerwiegenden Notlagen in der Bevölkerung. Deshalb werden immense Ressourcen in die Sicherstellung der kontinuierlichen Verfügbarkeit dieser Dienste investiert, einschließlich der Implementierung redundanter Systeme und Notfallpläne.

Inhaltsverzeichnis

Verfügbarkeit, Qualität und Sicherheit

Neben der ständigen Verfügbarkeit ist die Verlässlichkeit ein entscheidender Faktor. Kritische Infrastrukturen müssen nicht nur rund um die Uhr funktionieren, sondern auch unter allen Umständen eine hohe Qualität und Sicherheit gewährleisten. Dies beinhaltet den Schutz vor physischen und kybernetischen Bedrohungen sowie die Widerstandsfähigkeit gegenüber Naturkatastrophen und anderen unvorhersehbaren Ereignissen. Die Herausforderung liegt darin, diese Systeme so zu gestalten, dass sie selbst unter extremen Bedingungen verlässlich bleiben und somit das Vertrauen der Gesellschaft in ihre Robustheit stärken.

Effizienz als Optimierung von Ressourcen

Effizienz ist ebenfalls ein Schlüsselelement, insbesondere vor dem Hintergrund begrenzter Ressourcen und des wachsenden Umweltbewusstseins. Kritische Infrastrukturen müssen nicht nur effektiv, sondern auch effizient sein, um den ökologischen Fußabdruck zu minimieren und die langfristige Nachhaltigkeit zu gewährleisten. Dies erfordert innovative Ansätze und Technologien, die eine Optimierung des Energieverbrauchs, der Materialnutzung und der Betriebsabläufe ermöglichen. Die Balance zwischen hoher Verfügbarkeit, Verlässlichkeit und Effizienz zu finden, ist eine komplexe Aufgabe, die fortlaufende Investitionen und Entwicklungen erfordert.

Die Bedeutung der Systemredundanz

In der Welt der Kritischen Infrastrukturen ist die Sicherheit von unschätzbarem Wert. Alle elektronischen Systeme Kritischer Infrastrukturen spielen eine zentrale Rolle im täglichen Leben der Gesellschaft, und ihre Zuverlässigkeit muss unter allen Umständen gewährleistet sein. Eine der Schlüsselstrategien zur Sicherung dieser Systeme ist die Implementierung von Systemredundanzen. Dieser Ansatz sorgt dafür, dass bei einem Ausfall eines Teils des Systems ein Backup in gewissen Umfang zur Verfügung steht, was die Resilienz des gesamten Systems erhöht und potenzielle Risiken minimiert.

Was versteht man unter Systemredundanz?

Systemredundanz bezieht sich auf die Einrichtung von zusätzlichen oder alternativen Systemkomponenten, die im Falle eines Ausfalls oder Fehlers eines Teils des Hauptsystems manuell oder automatisch aktiviert werden können. Diese redundanten Komponenten können identisch sein oder unterschiedliche Funktionen bieten, die sicherstellen, dass das primäre Systemziel auch bei Teilausfällen weiterhin erfüllt wird. Redundanz kann in verschiedenen Formen realisiert werden, einschließlich, aber nicht beschränkt auf physische, datenbezogene und operationale Redundanz.

Redundanzkonzepte für kritische Infrastrukturen - Hochverfügbarkeit

Bewertung der Systemredundanz

Was sich in der Theorie einleuchtend und einfach anhört sieht jedoch in der Praxis wesentlich komplexer aus. Grundsätzlich muss bei der Systemredundanz zwischen nachrichtentechnischen IP-basierenden Systemen und technischen Einrichtungen der Stromversorgung unterschieden werden.

Bei IP-basierenden Systemen wird sich die Systemredundanz immer auf die Zentralentechnik beziehen. Die Komponenten in der Peripherie sind in der Regel hiervon ausgenommen.

Bei der Systemredundanz spielt die Stromversorgung eine zentrale Rolle. Eine Systemredundanz macht nur dann Sinn, wenn zum einen die Zentralkomponenten beispielsweise über jeweils zwei Netzteile verfügen und diese zum anderen auch aus zwei unterschiedlichen Stromquellen gespeist werden.

Oft haben die Liegenschaften der Kritischen Infrastrukturen erhebliche Ausdehnungen mit entsprechend vielen technischen Systemen. So ist es nichts ungewöhnliches, wenn derartige Infrastrukturen eine Perimeter Sicherung (Zaundetektion), eine Zutrittskontrollanlage, eine Videoüberwachungsanlage, eine Personen-Notsignal-Anlage, eine Einbruchmeldeanlage, eine Brandmeldeanlage, eine Freiflächen- bzw. Perimeter Beleuchtungsanlage und unter Umständen auch noch eine Objektfunkanlage beherbergen. Häufig sind derartige technische Strukturen über viele Jahre gewachsen. Dies bedeutet das Zusammentreffen unterschiedlichster Systemgenerationen.

Bei diesen oftmals heterogenen Systemen ist die Herstellung einer Systemredundanz oftmals, wenn überhaupt, technisch nur sehr aufwendig umsetzbar.

Wichtigkeit der Redundanz für kritische Infrastrukturen

In kritischen Infrastrukturen kann der Ausfall eines einzigen Systems katastrophale Folgen haben, von Umweltkatastrophen bis hin zu wirtschaftlichen Verlusten und Gefahren für die öffentliche Sicherheit. Durch die Implementierung redundanter Systeme wird sichergestellt, dass der Betrieb fortgesetzt werden kann, selbst wenn einzelne Komponenten ausfallen. Diese Strategie ist entscheidend für die Aufrechterhaltung der Dienstleistungen und der Sicherheit, auf die sich die Gesellschaft täglich verlässt.

Praktische Umsetzung der Redundanz

Die Implementierung von Redundanz in Sicherheitssystemen umfasst mehrere Schritte, die sorgfältig geplant und umgesetzt werden müssen:

1. Analyse der kritischen Systemkomponenten: Zuerst muss bestimmt werden, welche Teile des Systems unverzichtbar und wo Redundanzen erforderlich sind.

2. Auswahl geeigneter redundanter Systeme: Abhängig von der Funktion und Wichtigkeit der verschiedenen Systemkomponenten werden entsprechende redundante Lösungen entwickelt. In der Regel wird man sich immer auf die zentralen Server-Systemkomponenten fokussieren, Geräte in der Peripherie bleiben allein aus wirtschaftlicher Hinsicht bei Hochverfügbarkeitsüberlegungen außen vor.

3. Integration in die bestehende Infrastruktur: Die redundanten Systeme müssen nahtlos in die bestehende Infrastruktur integriert werden, um eine schnelle Aktivierung im Notfall zu gewährleisten.

4. Regelmäßige Wartung und Tests: Redundante Systeme müssen regelmäßig gewartet und getestet werden, um ihre vollständige Funktionsfähigkeit sicherzustellen und mögliche Fehlerquellen frühzeitig zu erkennen.

Wichtig in diesem Zusammenhang sind auch sogenannte Schwarztests oder Blackout-Tests.

Redundanz als Grundlage von Hochverfügbarkeit

Hochverfügbarkeit ist ein zentrales Konzept welches darauf abzielt Systemausfälle zu minimieren und sicherzustellen, dass Dienste auch im Falle von Hardware- oder Softwareproblemen weiterhin zugänglich bleiben. Eine der gängigsten Methoden zur Quantifizierung der Verfügbarkeit ist das sogenannte 9er-System, das die Zuverlässigkeit von Systemen in Prozentwerten und „Neunen“ ausdrückt.

Grundlagen Hochverfügbarkeit 9er-System

Das 9er-System ist eine Methode zur Klassifizierung der Verfügbarkeit von IT-Diensten oder Netzwerken. Es wird oft verwendet, um die Betriebszeit eines Systems im Verhältnis zu seiner Gesamtbetriebszeit über einen bestimmten Zeitraum hinweg zu messen. Die Verfügbarkeit wird in Prozent angegeben und durch die Anzahl der Neunen nach dem Komma illustriert. Je mehr Neunen, desto höher die Verfügbarkeit und desto geringer die erlaubte Ausfallzeit über ein Jahr:

Zwei Neuner (99 %) erlauben eine Ausfallzeit von 3,65 Tagen pro Jahr, dies entspricht der Verfügbarkeitsklasse (VK) 2.

Drei Neuner (99,9 %) reduzieren die Ausfallzeit auf etwa 8,76 Stunden pro Jahr, dies entspricht der Verfügbarkeitsklasse (VK) 3.

Vier Neuner (99,99 %) bedeuten, dass das System weniger als 53 Minuten pro Jahr nicht verfügbar sein darf, dies entspricht der Verfügbarkeitsklasse (VK) 4 bzw. der Tier-Klasse IV.

Fünf Neuner (99,999 %) oft als der Goldstandard der Netzwerkverfügbarkeit betrachtet, limitieren die Ausfallzeit auf etwa 5 Minuten und 15 Sekunden pro Jahr, dies entspricht der Verfügbarkeitsklasse (VK) 5.

Sechs Neuner (99,9999 %) bedeutet, dass ein System in einem Jahr für höchstens etwa 31,5 Sekunden nicht verfügbar sein darf. Dieser Standard von Hochverfügbarkeit stellt extrem hohe Anforderungen an die Infrastruktur und das Management von IT-Diensten, da jegliche Downtime auf ein absolutes Minimum reduziert werden muss, dies entspricht der Verfügbarkeitsklasse (VK) 6. Kritische Komponenten des Systems müssen mehrfach vorhanden sein, so dass im Falle eines Ausfalls sofort auf ein Backup-System umgeschaltet werden kann.

Dies betrifft Hardware, wie Server und Netzwerkkomponenten, ebenso wie Stromversorgungen und Kühlungssysteme. Die Systeme müssen so gestaltet sein, dass sie auch bei einem teilweisen Ausfall bestimmter Komponenten weiterhin funktionieren können, ohne dass es zu einer Beeinträchtigung der Gesamtleistung kommt. Im Falle eines Ausfalls muss das System in der Lage sein, automatisch auf redundante Systeme umzuschalten, ohne dass menschliches Eingreifen erforderlich ist. Um Risiken wie Naturkatastrophen oder regionale Stromausfälle zu minimieren, sollten die Daten und Dienste auf mehrere, geografisch getrennte Datenzentren verteilt werden.

Prinzipien zur Steigerung der Verfügbarkeit

In IT-Infrastrukturen ist die Verfügbarkeit von Diensten entscheidend, insbesondere wenn es um kritische Anwendungen geht, die hohe Anforderungen an die Betriebskontinuität stellen. Um die Zuverlässigkeit und die ständige Verfügbarkeit dieser Dienste zu gewährleisten, gibt es grundlegende Prinzipien, die bei der Planung und Implementierung beachtet werden müssen. Diese umfassen u. a. die Fehlertoleranz, Redundanz, Robustheit, Separation und Automatisierung. Jedes dieser Prinzipien trägt auf seine Weise dazu bei, die Systemintegrität und -leistung unter verschiedenen Bedingungen zu erhalten.

Fehlertoleranz

Fehlertoleranz bezieht sich auf die Fähigkeit eines Systems, im Falle eines Teilausfalls weiterhin funktionsfähig zu bleiben. Dies wird oft durch das Design von Systemen erreicht, die in der Lage sind, Fehler zu erkennen, zu isolieren und zu korrigieren, ohne dass der Benutzer davon beeinträchtigt wird. Beispielsweise können in einem fehlertoleranten System mehrere Prozessoren parallel arbeiten, sodass bei Ausfall eines Prozessors die anderen ungestört weiterlaufen können.

Redundanz

Redundanz ist das Prinzip, mehrfach ausgelegte Systemkomponenten bereitzustellen, um eine hohe Verfügbarkeit zu gewährleisten. Dies kann die Duplikation von Hardware, Software, Netzwerken und Stromversorgungen umfassen. Redundante Systeme sind so konzipiert, dass sie bei einem Ausfall einer Komponente nahtlos auf eine Backup-Komponente umschalten können, was die Systemausfallzeiten minimiert.

Robustheit

Robustheit in IT-Systemen bezieht sich auf deren Fähigkeit, unter einer Vielzahl von Betriebsbedingungen effektiv zu funktionieren und externen Störungen oder Angriffen standzuhalten. Dies erfordert umfassende Tests und die Verwendung hochwertiger Komponenten und Software, die auch unter extremen oder unerwarteten Bedingungen zuverlässig sind.

Separation

Die Separation oder Trennung von Ressourcen dient der Isolation von Systemkomponenten, um zu verhindern, dass ein Fehler in einem Bereich sich auf andere auswirkt. Dies kann durch physische oder logische Trennung erfolgen, wie beispielsweise die Nutzung separater Server für unterschiedliche Dienste oder die Segmentierung von Netzwerken. Eine effektive Separation hilft, Risiken zu minimieren und erleichtert die Wartung und das Management von Systemen.

Automatisierung

Automatisierung spielt eine entscheidende Rolle bei der Steigerung der Verfügbarkeit von IT-Diensten. Sie minimiert menschliche Fehler und ermöglicht schnellere Reaktionen auf Probleme. Automatisierte Überwachungssysteme können Systemfehler erkennen und oft selbstständig beheben oder zumindest schnell Alarm schlagen, so dass das technische Personal sofort eingreifen kann.

Schwarztest zur Überprüfung der Verfügbarkeit

Schwarztest zur Überprüfung der Systemresilienz und Verfügbarkeit

Schwarztests, auch bekannt als Blackout-Tests, sind ein entscheidender Bestandteil der Überprüfungsstrategien für Notfallpläne und Backup-Systeme in kritischen Infrastrukturen und IT-Umgebungen. Diese Tests simulieren einen vollständigen Stromausfall oder den Ausfall kritischer Systemkomponenten, um die Reaktionsfähigkeit und Wirksamkeit der Notfallmaßnahmen und -systeme unter realistischen Bedingungen zu überprüfen.

Ziel und Durchführung von Schwarztests

Das Hauptziel eines Schwarztests ist es, sicherzustellen, dass alle notwendigen Systeme und Prozeduren bei einem unerwarteten vollständigen Systemausfall funktionieren. Dies umfasst die Überprüfung von Notstromversorgungen wie Generatoren und USV-Anlagen, die Funktionalität von nachrichtentechnischen IT-Systemen sowie die Effektivität der Kommunikationsmittel unter Notfallbedingungen.

Die Durchführung eines Schwarztests erfordert die sorgfältige Planung und Koordination, um die Sicherheit aller Beteiligten zu gewährleisten und zu verhindern, dass der Test selbst zu ungewollten Störungen oder Schäden führt. In der Regel werden solche Tests in Zeiten minimaler Aktivität durchgeführt, beispielsweise nachts oder am Wochenende, um die Auswirkungen auf den normalen Betrieb zu minimieren.

Wichtige Schritte bei einem Schwarztest

Planung und Vorbereitung: Ein umfassender Plan, der alle zu testenden Systeme und die erwarteten Reaktionen auf den Ausfall umfasst, wird erstellt. Beteiligtes Personal wird über Ziele und Verfahren des Tests informiert.

Durchführung des Tests: Der Test wird unter kontrollierten Bedingungen durchgeführt. Dabei wird in der Regel die Stromzufuhr für das Gebäude oder den zu testenden Bereich komplett abgeschaltet, um zu sehen, wie effektiv die Notstromversorgung und die Notfallverfahren funktionieren.

Monitoring und Dokumentation: Während des Tests werden alle Vorgänge genau überwacht und dokumentiert, um eine detaillierte Bewertung der Leistungsfähigkeit der Notfallsysteme und -protokolle zu ermöglichen.

Auswertung und Nachbereitung: Nach dem Test werden die gesammelten Daten analysiert, und es wird bewertet, ob und wie gut die verschiedenen Systeme und Prozesse funktioniert haben. Diese Informationen werden verwendet, um Schwachstellen zu identifizieren und Verbesserungen vorzunehmen.

Bedeutung von Schwarztests

Schwarztests sind von unschätzbarer Bedeutung für die Sicherheit und Zuverlässigkeit von Einrichtungen, die kritische Dienste anbieten, wie Krankenhäuser, Rechenzentren und Produktionsanlagen. Sie helfen nicht nur, Schwachstellen in den Notfallplänen zu identifizieren, sondern schaffen auch ein Bewusstsein und Verständnis für die praktische Anwendung dieser Pläne unter den Mitarbeitern.

Durch regelmäßig durchgeführte Schwarztests können Organisationen die Zuverlässigkeit ihrer Notfallinfrastrukturen sicherstellen und so die Risiken von Betriebsunterbrechungen minimieren. Dies trägt auch unter extremen Bedingungen entscheidend zu einer Stärkung einer kontinuierlichen Betriebsbereitschaft bei.

Fazit

In kritischen Infrastrukturen, die essenziell für das Funktionieren der modernen Gesellschaft und Wirtschaft sind, ist die Verfügbarkeit von Systemen nicht nur eine technische Notwendigkeit, sondern eine grundlegende Anforderung zur Aufrechterhaltung der öffentlichen Sicherheit und des sozialen Wohlergehens. Diese Systeme, zu denen Energieversorgung, Wasserversorgung, Gesundheitsdienste, Transport und Kommunikation gehören, müssen gegen Ausfälle robust gesichert sein, da Unterbrechungen katastrophale Auswirkungen auf die Bevölkerung und die Umwelt haben können.

Die Gewährleistung der Hochverfügbarkeit in diesen Bereichen erfordert eine durchdachte Planung, Implementierung und ständige Wartung der Infrastruktur, um Ausfallzeiten zu minimieren und schnell auf unvorhersehbare Ereignisse reagieren zu können. Die Prinzipien der Redundanz, Fehlertoleranz und Automatisierung sind dabei unverzichtbar Parameter für das zuverlässige funktionieren Kritischer Infrastrukturen.

NUTZUNG | HAFTUNG
Trotz sorgfältiger Kontrolle übernehmen wir keine Gewähr für die Richtigkeit und Vollständigkeit der Inhalte.

24/7-Betrieb, 9er System, AEC-0 bis AEC-5, Availability Environment Classification (AEC), Betriebszeiten, Hauptbetriebszeiten, Klassifizierung des BSI, Tier-Klasse, Tier-Topologie

Schutz Kritischer Infrastrukturen Teil 3: KRITIS Verfügbarkeit