Die Welt der Videoüberwachungstechnik, fachlich präziser als Video Surveillance Systems (VSS) bezeichnet, steht an einem historischen Wendepunkt. Mit der Veröffentlichung der internationalen Norm IEC 62676-4:2025 im Oktober 2025 wurde nicht nur ein technisches Regelwerk aktualisiert, sondern das fundamentale Verständnis davon, was eine Videoüberwachungsanlage zu leisten imstande ist, neu definiert.
Erstmals rückt ein Parameter ins Zentrum, der physikalisch nie verhandelbar war, planerisch jedoch systematisch ignoriert wurde: Die Pixeldichte. Sie entscheidet darüber, ob ein Bild zur Aufklärung taugt oder lediglich zur Beruhigung des Gewissens. Jahrelang wurde dieser Zusammenhang von marketinggetriebenen Megapixel-Zahlen überdeckt, mit dem Ergebnis, dass hochauflösende Kameras zwar beeindruckende Datenmengen produzierten, in der Praxis jedoch häufig an der eigentlichen Aufgabe scheiterten.
Über Jahrzehnte hinweg orientierte sich die Sicherheitsbranche an Modellen, die ihre Wurzeln noch in der analogen Fernsehtechnik hatten. Das Verständnis von Auflösung war geprägt durch TV-Linien und die vertikale Bildhöhe auf Röhrenmonitoren. Mit dem Siegeszug der digitalen IP-Videoüberwachung und der damit einhergehenden Explosion der verfügbaren Auflösungen, von HD über 4K bis hin zu 8K, entstand eine Diskrepanz zwischen der nominellen Auflösung eines Sensors und der tatsächlichen, forensisch verwertbaren Bildinformation am Objekt. Planer und Errichter sahen sich zunehmend mit der Situation konfrontiert, dass Kunden zwar „4K-Qualität“ kauften, aber aufgrund falscher Objektivwahl oder zu großer Distanzen dennoch keine Gesichter identifizieren konnten.
Die IEC 62676-4:2025 adressiert dieses Problem radikal, indem sie das bisherige MDORII-Modell (Monitor, Detect, Observe, Recognize, Identify, Inspect) der Vorgängernorm von 2014 ablöst und durch das wesentlich granularere und anspruchsvollere OODPCVS-Modell (Overview, Outline, Discern, Perceive, Characterise, Validate, Scrutinise) ersetzt. Diese Neuerung ist weit mehr als eine semantische Spielerei, sie stellt eine massive Verschärfung der Qualitätsanforderungen dar und zwingt die Branche dazu, den Parameter Pixeldichte als die einzig valide Währung für Bildqualität zu akzeptieren.
Dieser Artikel widmet sich einer tiefgreifenden Analyse dieser neuen Norm. Er wird die physikalischen und technischen Grundlagen der Pixeldichte erläutern, die beiden Modelle MDORII und OODPCVS detailliert gegenüberstellen und insbesondere die praktischen Auswirkungen der neuen, extremen Anforderungen untersuchen. Ein besonderer Fokus liegt dabei auf der kritischen Würdigung der Wirtschaftlichkeit von Hochauflösungsanforderungen wie „Scrutinise“ (1500 px/m) im Kontext großer Liegenschaften sowie der operativen Sinnhaftigkeit der niedrigsten Auflösungsstufen.
Das Wichtigste vorab, die zentralen Erkenntnisse:
- Verschärfte Anforderungen: Was früher als Standard für „Identifizierung“ galt mit 250 px/m, reicht nach neuer Norm nur noch zur „Charakterisierung“. Für eine gerichtsfeste Identifizierung oder zuverlässige Gesichtserkennung fordert die Stufe Validate nun 500 px/m.
- Neues Modell (OODPCVS): Das bekannte MDORII-Modell (Monitor, Detect, Observe, Recognize, Identify, Inspect) ist obsolet. Es wird durch das präzisere OODPCVS-Modell (Overview, Outline, Discern, Perceive, Characterise, Validate, Scrutinise) ersetzt, das digitale Bildfehler stärker berücksichtigt.
- Kostenfalle „Scrutinise“: Die höchste Stufe Scrutinise (1500 px/m) ist für die Flächenüberwachung (z. B. Zäune) wirtschaftlich kaum darstellbar und physikalisch problematisch durch eine geringe Schärfentiefe. Diese Auflösung sollte auf kontrollierte Nahbereiche beschränkt bleiben.
- Sicherheitsrisiko niedrige Auflösung: Die Einstiegsstufen Overview (20 px/m) und Outline (40 px/m) bieten keine ausreichende Detailtiefe für eine Alarmverifizierung. Wer sich darauf verlässt, erhält lediglich die Information „da ist etwas“, kann aber nicht zwischen einem Mensch, Tier oder Fehlalarm unterscheiden.
- Planungssicherheit: Die Pixeldichte (Pixel pro Meter am Objekt) ist die einzige verlässliche Währung für Bildqualität. Reine Megapixel-Angaben von Kameras ohne Bezug zu Brennweite und Distanz sind für Sicherheitskonzepte wertlos.

INHALTSVERZEICHNIS
1. Physikalische und technische Grundlagen der Pixeldichte
1.1 Definition und Bedeutung der Pixeldichte
Die Pixeldichte ist der entscheidende qualitative Parameter in der digitalen Bildverarbeitung für Sicherheitsanwendungen. Während die Auflösung (z. B. 3840 x 2160 Pixel) lediglich die Gesamtzahl der Bildpunkte auf dem Sensor beschreibt, gibt die Pixeldichte an, wie viele dieser Bildpunkte tatsächlich ein spezifisches Objekt in der realen Welt abbilden. Sie wird in der Regel in Pixel pro Meter (px/m) oder Pixel pro Fuß (px/ft) am Ort des Objekts angegeben.
Die Pixeldichte ist somit eine Funktion aus drei Variablen: der Brennweite des Objektivs, der Auflösung des Sensors und der Entfernung zum Objekt. Ein häufiges Missverständnis in der Praxis ist die Annahme, dass eine Kamera mit höherer Megapixel-Zahl automatisch eine höhere Erkennungsleistung bietet. Dies ist ein Trugschluss. Eine 2-Megapixel-Kamera, die mit einem Teleobjektiv auf einen schmalen Durchgang gerichtet ist, kann eine weitaus höhere Pixeldichte auf einem Gesicht erzeugen als eine 8-Megapixel-Kamera (4K), die mit einem Weitwinkelobjektiv einen großen Parkplatz überwacht.
Die Norm IEC 62676-4:2025 verankert die Pixeldichte als das zentrale Kriterium für die Planung. Sie fordert, dass für jedes zu überwachende Ziel (Mensch, Fahrzeug, Kennzeichen) vorab definiert wird, welche Informationstiefe benötigt wird, und die Anlage so dimensioniert wird, dass die geforderte Pixeldichte am Zielort erreicht wird.
1.2 Mathematische Herleitung und Einflussfaktoren
Die Berechnung der Pixeldichte (PDm = Pixel Density per meter (px/m)) erfolgt gemäß der Norm und physikalischer Gesetzmäßigkeiten nach der Formel:
PDm = Rh / Wfov
Dabei ist Rh die horizontale Auflösung der Kamera in Pixeln und Wfov die Breite des Sichtfeldes (Field of View) in Metern an der Entfernung des Objekts.
Die Breite des Sichtfeldes wiederum hängt von der Sensorgröße, der Brennweite und der Distanz ab:
Wfov = (d * wsensor) / f
Hierbei ist:
- d = Distanz zum Objekt (m)
- wsensor = Breite des Bildsensors (mm)
- f = Brennweite (mm)
Kombiniert man diese Formeln, ergibt sich die Abhängigkeit:
PDm = (Rh * f) / (d * wsensor)
Diese Formel verdeutlicht die Hebelwirkung der Brennweite (f) und der Distanz (d). Um die Pixeldichte zu verdoppeln, muss man entweder die Distanz halbieren oder die Brennweite verdoppeln, was das Sichtfeld halbiert. Dies hat massive Auswirkungen auf die Anzahl der benötigten Kameras, wie später in der wirtschaftlichen Betrachtung gezeigt wird.
Ein weiterer kritischer Faktor, den die neue Norm stärker berücksichtigt, ist der Einfluss von Kompression und Rauschen. Die theoretisch berechnete Pixeldichte ist ein Brutto-Wert. In der Praxis reduzieren Videocodecs wie H.264 oder H.265 durch Quantisierung hochfrequente Bildanteile (Details). Bei schlechten Lichtverhältnissen kommt Bildrauschen hinzu, das feine Strukturen überlagert. Daher fordert die IEC 62676-4:2025 deutlich höhere Brutto-Pixeldichten für Aufgaben wie Identifizierung, um sicherzustellen, dass nach Abzug der technischen Verluste noch genügend Netto-Information für eine Verifizierung übrigbleibt.

2. Das Erbe der Vergangenheit: Analyse des MDORII-Modells (IEC 62676-4:2014)
Um die Tragweite der Änderungen in der Version 2025 zu verstehen, ist ein Blick auf den Vorgängerstatus unerlässlich. Die IEC 62676-4:2014 etablierte das MDORII-Modell, das über ein Jahrzehnt lang die internationale Sprache der Videoüberwachung prägte.
2.1 Die Stufen des MDORII-Modells
Das Akronym MDORII steht für sechs Qualitätsstufen, die jeweils einer spezifischen Pixeldichte zugeordnet waren:
- Monitor (Überwachen) – 12,5 px/m: Diese niedrigste Stufe war dazu gedacht, Bewegungen in einem weiten Bereich zu erkennen oder Menschenmengen zu kontrollieren. Die Dichte von 12,5 px/m bedeutete, dass ein Mensch (ca. 0,5 m breit) durch etwa 6 Pixel dargestellt wurde. Kritik: In der Praxis war diese Stufe oft wertlos, da sie keinerlei Differenzierung erlaubte. Besteht ein Bildobjekt aus nur sechs Pixeln, kann es ebenso gut eine Person, ein Busch oder schlicht ein Licht- oder Schatteneffekt sein.
- Detect (Detektieren) – 25 px/m: Hier sollte der Bediener entscheiden können, ob ein Mensch vorhanden ist oder nicht. Mit ca. 12-13 Pixeln pro Person war die Fehlalarmrate bei visueller Prüfung hoch. Kritik: Für moderne Videoanalytik oft zu wenig, für das menschliche Auge ermüdend und unsicher.
- Observe (Beobachten) – 62,5 px/m: Diese Stufe sollte charakteristische Details wie Kleidung zeigen. Sie war ein Kompromiss für Übersichtskameras, die auch forensisch etwas bieten sollten.
- Recognize (Erkennen) – 125 px/m: Definition: Eine bekannte Person kann wiedererkannt werden. Problem: Der Begriff „Erkennen“ (Recognize) suggerierte oft fälschlicherweise eine Identifizierung. In der Realität bedeutet dies nur: „Ich weiß, dass das Herr Müller ist, weil ich ihn kenne“, nicht aber: „Ich kann beweisen, dass dies eine fremde Person X ist“.
- Identify (Identifizieren) – 250 px/m: Der Goldstandard der alten Norm. 250 px/m galten als ausreichend für eine zweifelsfreie Identifizierung unbekannter Personen. Das Scheitern: Mit dem Aufkommen effizienter Kompressionsverfahren und schlechten Lichtverhältnissen stellte sich heraus, dass 250 px/m oft nur „Pixelmatsch“ lieferten, der vor Gericht nicht standhielt.
- Inspect (Begutachten/Überprüfen) – 1000 px/m: Gedacht für Hochsicherheitsanwendungen wie Casinos oder Banken (Geldzählen). Diese Stufe wurde in der allgemeinen Überwachung selten angewandt.
2.2 Warum MDORII scheiterte
Das MDORII-Modell war konzeptionell noch tief in der Logik klassischer, analog geprägter Videosysteme verankert. Seine Bewertungsgrundlage orientierte sich maßgeblich an der PAL-Auflösung mit 576i, einem Zeilensystem, bei dem Bildqualität nicht über absolute Bildinformationen, sondern über relative Anteile der Bildhöhe beschrieben wurde. Entsprechend wurden Qualitätsanforderungen in Prozent der vertikalen Bildausdehnung angegeben – ein Ansatz, der in einer zeilenbasierten Welt sinnvoll war, jedoch keine direkte Aussage über die tatsächlich verfügbare Detailinformation zuließ.
Mit dem Übergang zu digitalen, hochauflösenden Kamerasystemen offenbarte dieses Modell zunehmend seine Grenzen. Unterschiedliche Sensorauflösungen, Seitenverhältnisse, Objektive und Blickwinkel ließen sich mit prozentualen Bildhöhen nur noch abstrakt vergleichen. Die zentrale Frage – wie viele verwertbare Bildinformationen in einem realen Szenenbereich tatsächlich vorhanden sind – blieb unbeantwortet. MDORII beschrieb damit eher ein geometrisches Verhältnis im Bild als die tatsächliche visuelle Aussagekraft der Aufnahme.
In einer Zeit, in der Videoüberwachungssysteme längst pixelbasiert arbeiten und ihre Leistungsfähigkeit nicht mehr von Zeilenzahlen, sondern von der effektiven Pixeldichte in der Szene abhängt, wurde dieser Ansatz zunehmend anachronistisch. Die Orientierung an PAL-Logiken machte deutlich, dass MDORII zwar historisch verständlich, für moderne Video Surveillance Systems jedoch nur noch eingeschränkt geeignet war.
Die Umrechnung in Pixeldichte war ein Versuch, dies zu digitalisieren, doch die Werte waren zu niedrig angesetzt. Insbesondere die Stufe „Identify“ mit 250 px/m erwies sich in realen Szenarien – mit Bewegungsunschärfe, Gegenlicht und Kompressionsartefakten – als unzureichend für moderne forensische Ansprüche. Die Industrie benötigte ein Modell, das die technologischen Fortschritte (KI, Hochauflösung) und die gestiegenen Sicherheitsbedürfnisse besser abbildete.

3. Der Paradigmenwechsel: Das OODPCVS-Modell der IEC 62676-4:2025
Mit der Revision 2025 führt die IEC das OODPCVS-Modell ein. Dieses Akronym steht für Overview, Outline, Discern, Perceive, Characterise, Validate, Scrutinise. Es unterteilt die Anforderungen in zwei Hauptkategorien: Low Pixel Density Objects (LPDO) und High Pixel Density Objects (HPDO).
Diese Neustrukturierung ist kein bloßes Rebranding, sondern eine fundamentale Neukalibrierung der Pixeldichte-Anforderungen.
3.1 Low Pixel Density Object (LPDO)
Diese Kategorie umfasst die unteren drei Stufen, die primär für die Detektion und grobe Klassifizierung in weiten Bereichen (Perimeter, Freiflächen) gedacht sind.
3.1.1 Overview (Überblick) – 20 px/m
Die neue Einstiegsstufe Overview ersetzt das alte „Monitor“ und hebt die Anforderung von 12,5 auf 20 px/m an.
- Definition: Dient dazu, Szenerien grob zu erfassen. Man sieht Gruppen von Objekten oder große Bewegungen.
- Anwendung: Weiträumige Landschaftsbeobachtung, Verkehrsfluss (Stauerkennung ohne Details).
- Analyse: Trotz der Anhebung bleibt der Informationsgehalt minimal. Ein Mensch wird durch ca. 10 Pixel in der Breite dargestellt.
3.1.2 Outline (Erfassen/Umriss) – 40 px/m
Die Stufe Outline fordert 40 px/m, was einer signifikanten Steigerung gegenüber dem alten „Detect“ (25 px/m) entspricht.
- Definition: Die Kontur eines Objekts ist klar erkennbar. Man kann unterscheiden, ob ein Objekt aufrecht steht (Mensch) oder horizontal orientiert ist (Tier/Auto).
- Anwendung: Zaundetektion, Vorfeldüberwachung.
- Analyse: Dies ist die erste Stufe, bei der eine KI-gestützte Objektklassifizierung (Mensch vs. Fahrzeug) mit akzeptabler Fehlerrate beginnen kann.
3.1.3 Discern (Unterscheiden) – 80 px/m
Mit 80 px/m führt die Norm eine neue Zwischenstufe ein, Discern.
- Definition: Ermöglicht die Unterscheidung von Details innerhalb einer Objektklasse. Beispiel: Unterscheidung zwischen uniformiertem Personal und Zivilisten oder zwischen Lieferwagen und PKW.
- Anwendung: Operative Steuerung von Sicherheitskräften, Parkraummanagement.
3.2 High Pixel Density Object (HPDO)
Diese Kategorie zielt auf die Erkennung individueller Merkmale und die forensische Verwertbarkeit ab.
3.2.1 Perceive (Wahrnehmen) – 125 px/m
Perceive entspricht numerisch dem alten „Recognize“ (125 px/m).
- Definition: Detaillierte Wahrnehmung von Merkmalen wie Kleidungsmuster, Haarfarbe oder mitgeführten Gegenständen. Eine Identifizierung ist nur bei vorheriger Bekanntheit möglich (Wiedererkennung).
- Anwendung: Einzelhandel (Laufwegeanalyse), öffentliche Plätze.
3.2.2 Characterise (Charakterisieren) – 250 px/m
Hier vollzieht sich der kritischste Wandel. 250 px/m, früher der Standard für „Identifizierung“, wird nun als Characterise eingestuft.
- Definition: Erlaubt die genaue Beschreibung einer Person (Narben, Tattoos, Schmuck), garantiert aber keine zweifelsfreie Identifizierung einer unbekannten Person durch Gesichtserkennungssysteme oder Gutachter.
- Implikation: Dies ist ein Eingeständnis der Normungsgremien, dass 250 px/m unter realen Bedingungen oft nicht ausreichen, um eine Person „beyond reasonable doubt“ – über jeden vernünftigen Zweifel hinaus, zu identifizieren.
3.2.3 Validate (Validieren) – 500 px/m
Die Stufe Validate mit 500 px/m ist der neue Goldstandard für Identifizierungsaufgaben.
- Definition: Ermöglicht die Validierung der Identität einer Person mit hoher Sicherheit. Dies ist die empfohlene Pixeldichte für moderne Gesichtserkennungsalgorithmen und automatisierte Prozesse.
- Anwendung: Zutrittskontrollpunkte, Schleusen, Grenzkontrollen, Casino-Eingänge.
- Bedeutung: Die Verdopplung der Pixeldichte gegenüber der alten Identifizierungsstufe bedeutet eine Vervierfachung der benötigten Bildinformation (Fläche). Dies hat massive Auswirkungen auf Speicher und Bandbreite.
3.2.4 Scrutinise (Untersuchen/Überprüfen) – 1500 px/m
Die höchste Stufe Scrutinise fordert extreme 1500 px/m.
- Definition: Diese Qualität entspricht der eines Passfotos und erlaubt die Analyse mikroskopischer Details. Es ermöglicht eine Identifizierung mit an Sicherheit grenzender Wahrscheinlichkeit, selbst unter widrigen Umständen.
- Anwendung: Prüfung von Ausweisdokumenten, Geldzählen, Analyse von Spielkarten/Chips, forensische Detailanalyse.

4. Vergleichende Analyse: OODPCVS vs. MDORII
Die folgende Tabelle stellt die Entwicklung der Pixeldichte-Anforderungen detailliert gegenüber und verdeutlicht die Verschiebung der Qualitätsmaßstäbe:
| Pixeldichte (px/m) | IEC 62676-4:2014 (MDORII) | IEC 62676-4:2025 (OODPCVS) | Technologische Implikation |
| 12,5 | Monitor (Überwachen) | Entfallen | Als unzureichend für Sicherheitszwecke eliminiert. |
| 20 | – | Overview (Überblick) | Neuer Mindeststandard für Situationsbewusstsein. |
| 25 | Detect (Detektieren) | – | Veraltet; zu gering für verlässliche KI-Detektion. |
| 40 | – | Outline (Erfassen) | Neue Basis für Detektion; +60% Dichte nötig. |
| 62,5 | Observe (Beobachten) | – | Ersetzt durch granularere Stufen. |
| 80 | – | Discern (Unterscheiden) | Neue Stufe für Klassifizierung (Mensch/Tier/Auto). |
| 125 | Recognize (Erkennen) | Perceive (Wahrnehmen) | Begriffliche Schärfung: Wahrnehmung ≠ Identität. |
| 250 | Identify (Identifizieren) | Characterise (Charakterisieren) | Down-Grading: 250 px/m reichen nicht mehr zur sicheren Identifizierung. |
| 500 | – | Validate (Validieren) | Neuer Standard für Gesichtserkennung und Identität. |
| 1000 | Inspect (Überprüfen) | – | Veraltet. |
| 1500 | – | Scrutinise (Untersuchen) | Neue Höchststufe für forensische Analytik. |
Kernaussage: Die Norm hat die Anforderungen drastisch erhöht. Wer heute eine Ausschreibung auf Basis von „Identifizierung“ gewinnt und „nur“ 250 px/m liefert, wie es 2014 korrekt war, liefert nach der 2025er Norm nur noch „Charakterisierung“ – eine potentielle juristische Falle für Errichter und Planer.

5. Kritische Bewertung der 1500 px/m („Scrutinise“) Anforderung
Die Einführung der Qualitätsstufe Scrutinise mit einer Pixeldichte von 1500 px/m stellt die Branche vor enorme Herausforderungen. Während diese Auflösung im Nahbereich (z. B. 1-2 Meter Abstand) technisch beherrschbar ist, erscheint ihre Anwendung auf größere Distanzen oder flächendeckend bei großen Liegenschaften als hochproblematisch.
5.1 Wirtschaftliche Unmöglichkeit bei großen Liegenschaften (Perimeterschutz)
Die Forderung nach 1500 px/m ist für die flächendeckende Überwachung von Perimetern (Zäunen) oder großen Arealen (Flughäfen, Logistikzentren) wirtschaftlich vollkommen unrealistisch. Eine einfache mathematische Betrachtung belegt dies:
- Sichtfeld-Berechnung: Um eine Pixeldichte von 1500 px/m zu erreichen, darf das Sichtfeld (Wfov) einer Kamera nur eine bestimmte Breite haben.
- Bei einer 4K-Kamera (UHD, ca. 3840 horizontale Pixel):
Wfov = 3840 Pixel / 1500 px/m ≈ 2,56 Meter
- Das bedeutet: Eine hochmoderne 4K-Kamera kann in der Qualitätsstufe Scrutinise lediglich einen Zaunabschnitt von 2,56 Metern überwachen.
- Skalierung und Kosten: Um einen Perimeter von 1000 Metern Länge (typisch für mittlere Industrieanlagen) in dieser Qualität zu überwachen, wären theoretisch:
1000 m / 2,56 m ≈ 391 Kameras
notwendig. Zum Vergleich: Bei der Stufe „Outline“ (40 px/m) würde eine 4K-Kamera ca. 96 Meter abdecken, man bräuchte also nur ca. 11 Kameras.
- Infrastruktur-Kollaps: Die Installation von fast 400 Kameras statt 11 würde die Kosten für Masten, Tiefbau, Verkabelung (Lichtwellenleiter), Switch-Ports und Lizenzen für das Videomanagementsystem (VMS) ins Unermessliche treiben.
- Datenflut: 391 4K-Streams würden eine Bandbreite von mehreren Gigabit pro Sekunde erzeugen und Petabytes an Speicherplatz für eine übliche Aufbewahrungsdauer (z. B. 30 Tage) benötigen. Dies steht in keinem Verhältnis zum Nutzen einer Perimetersicherung, wo primär Detektion („Da kommt jemand“) und nicht mikroskopische Analyse („Welche Marke hat der Knopf am Hemd?“) gefordert ist.
5.2 Physikalische Grenzen: Das Problem der Schärfentiefe
Selbst wenn Geld keine Rolle spielte, setzt die Physik der Scrutinise-Stufe auf Distanz enge Grenzen. Um 1500 px/m auf größere Entfernungen zu erreichen, sind Objektive mit extrem langen Brennweiten (Super-Teleobjektive) erforderlich.
- Schärfentiefe (Depth of Field – DoF): Je größer die Brennweite und je höher die Auflösung, desto geringer wird der Bereich, der im Bild scharf abgebildet wird.
- Bei einer Pixeldichte von 1500 px/m schrumpft die Schärfentiefe oft auf wenige Zentimeter zusammen.
- Praktische Konsequenz: Ein Eindringling, der sich nicht exakt auf der fokussierten Linie bewegt, sondern nur einen halben Meter davor oder dahinter, wird unscharf abgebildet. Die effektiv nutzbare Pixeldichte sinkt durch die optische Unschärfe („Blur“ – als unsichtbarer Gegner der Pixeldichte) drastisch ab. Der theoretische Wert von 1500 px/m wird zwar rechnerisch erreicht, liefert aber keinen Informationsgewinn, sondern nur „hochaufgelöste Unschärfe“.
- Umweltfaktoren: Auf Distanzen, die Teleobjektive erfordern, kommen atmosphärische Störungen hinzu. Hitzeflimmern (Schlieren), Nebel, Regen oder Vibrationen des Kameramastes durch Windlast ruinieren die Bildschärfe bei derart hohen Vergrößerungen sofort. Eine Pixeldichte von 1500 px/m ist im Außenbereich auf Distanz physikalisch kaum stabil aufrechtzuerhalten.
5.3 Fazit zu Scrutinise
Die Stufe Scrutinise ist ausschließlich für kontrollierte Szenarien im Nahbereich („Chokepoints“) geeignet, wie z. B. Personenschleusen, Dokumentenlesegeräte am Schalter oder die Überwachung von Spieltischen in Casinos. Als generelle Anforderung für Flächenüberwachung ist sie technisch fragwürdig und ökonomisch ruinös.

6. Kritische Bewertung der niedrigen Auflösungen (Overview & Outline)
Am anderen Ende des Spektrums definiert die Norm die Stufen Overview (20 px/m) und Outline (40 px/m). Auch hier ist eine kritische Distanz geboten, insbesondere hinsichtlich der Erwartungshaltung an „Sicherheit“.
6.1 Die „Overview“-Falle: 20 px/m sind keine Sicherheit
Die Stufe Overview mit 20 px/m bedeutet, dass ein Objekt von der Größe eines Menschen (ca. 50 cm Schulterbreite) durch lediglich 10 Pixel in der horizontalen Ausdehnung dargestellt wird.
- Visuelle Verifizierung unmöglich: Mit 10 Pixeln ist es für das menschliche Auge unmöglich, Strukturen zu erkennen. Ein Mensch, ein großer Hund, ein im Wind wehender Busch oder ein Schattenwurf sehen bei dieser Pixeldichte fast identisch aus.
- Keine Verifizierung: Wie in der Aufgabenstellung korrekt vermutet, ist eine Verifizierung eines Alarms bei 20 px/m ausgeschlossen. Der Operator in der Leitstelle sieht zwar, dass sich „etwas“ bewegt, kann aber nicht entscheiden, ob es sich um eine Gefahr handelt.
- Operatives Dilemma: Dies führt zu einem operativen Alptraum:
- Jede unscharfe Objektstruktur („Blob“) müsste als potenzieller Alarmfall bewertet und mit einer Entsendung von Wachpersonal beantwortet werden, mit entsprechend hohen Kosten durch eine Vielzahl von Falschalarmen.
- Oder der Operator ignoriert solche Alarme aufgrund der Häufigkeit („ist wahrscheinlich wieder nur ein Tier“), was das Sicherheitskonzept ad absurdum führt („Alarm Fatigue“ – Alarmmüdigkeit).
6.2 Grenzen der Videoanalytik (KI) bei niedriger Pixeldichte
Oft wird argumentiert, dass moderne KI (Künstliche Intelligenz) auch bei schlechter Auflösung funktioniert. Das ist nur bedingt richtig.
- Zwar können neuronale Netze (Deep Learning) Bewegungsmuster (Ganganalyse) auch bei niedrigen Auflösungen interpretieren.
- Doch für eine zuverlässige Klassifizierung (Unterscheidung Mensch vs. Tier) empfehlen führende Hersteller von Videoanalytik (z. B. Avigilon, Axis, Bosch) in der Regel Mindestwerte von 60 bis 80 px/m (also Stufe Discern oder Perceive).
- Bei 20 oder 40 px/m steigt die Fehlerrate der KI exponentiell an, insbesondere bei schlechtem Kontrast (Nacht, Regen, Tarnkleidung).
Fazit zu niedrigen Auflösungen: Die Stufen Overview und Outline sind im Kontext moderner Hochsicherheitsanforderungen eigentlich sinnbefreit, wenn sie als alleinige Quelle der Information dienen sollen. Sie haben ihre Berechtigung nur als:
- Ergänzung zu anderen Primärsensoren (z. B. Radar, Zaunsensoren), wo die Kamera nur die grobe Lage bestätigen soll.
- Trigger für PTZ-Kameras (Pan-Tilt-Zoom), die bei Detektion in die Zone zoomen und dann die erforderliche höhere Pixeldichte für die Verifizierung liefern („Slew-to-Cue“). Als alleinstehende statische Überwachung sind 20-40 px/m ein Sicherheitsrisiko.

7. Zusammenfassende Implikationen für die Planungspraxis
Die Einführung der IEC 62676-4:2025 mit dem OODPCVS-Modell hat weitreichende Konsequenzen für die Planung und Ausschreibung von VSS:
- Das Ende von „Pauschal-Identifizierung“: Es ist nicht mehr möglich und war es nie wirklich, riesige Flächen mit einer einzigen Kamera zu „identifizieren“. Planer müssen zwingend Zonierungskonzepte anwenden:
- Zufahrten/Schleusen -> Zone Validate (500 px/m).
- Verkehrswege -> Zone Discern (80 px/m).
- Zaungrenzen -> Zone Outline (40 px/m) + PTZ-Support.
- Explodierende Datenmengen: Der Shift von „Identify“ (250 px/m) zu „Validate“ (500 px/m) als Standard für Erkennung verdoppelt die lineare Auflösung und vervierfacht die Datenmenge (Pixelanzahl). IT-Abteilungen müssen ihre Speicher- und Netzwerkkalkulationen massiv nach oben korrigieren.
- Qualitätssicherung: Die Norm stärkt die Position seriöser Fachplaner. Billiganbieter, die mit falschen Versprechungen („Wir machen 100 Meter Identifizierung mit einer Kamera“) arbeiten, können nun anhand der Pixeldichte-Formel objektiv widerlegt werden. Die Abnahme einer Anlage wird messbar: Ein Testchart wird in der definierten Entfernung aufgestellt, und die Pixeldichte wird nachgemessen.

8. FAQs zur IEC 62676-4:2025 und Pixeldichte
1. Warum wurde das bewährte MDORII-Modell durch OODPCVS ersetzt?
Das MDORII-Modell (2014) basierte auf der Logik analoger Technik und unterschätzte die negativen Effekte digitaler Kompression und Bildrauschen. OODPCVS (2025) korrigiert dies, indem es präzisere Abstufungen einführt und die Anforderungen für Identifizierung (jetzt „Validate“) drastisch erhöht, um sicherzustellen, dass digitale Bilder auch forensisch und für KI-Systeme verwertbar sind.
2. Ist meine Bestandsanlage nach IEC 62676-4:2014 jetzt wertlos?
Technisch gesehen ändert sich die Leistung Ihrer Kameras nicht. Allerdings ändert sich die normative Bewertung. Eine Zone, die früher als „Identify“ (250 px/m) galt, erfüllt nach neuer Norm nur noch die Anforderung „Characterise“. Für juristische Bewertungen oder Versicherungsfragen bei Neuplanungen ist die neue Norm maßgeblich. Bestandsanlagen genießen meist Bestandsschutz, sollten aber bei Modernisierungen neu bewertet werden.
3. Benötige ich wirklich 1500 Pixel pro Meter (Scrutinise) im Perimeterschutz?
Nein, und es wäre wirtschaftlich und technisch fatal, dies zu versuchen. Die Stufe „Scrutinise“ ist für Spezialanwendungen im Nahbereich (Passkontrolle, Geldzählen) konzipiert. Für den Perimeterschutz sind Stufen wie „Outline“ oder „Discern“ (in Kombination mit PTZ-Verifizierung) der Standard. Eine Forderung nach 1500 px/m am Zaun zeugt von fehlerhafter Planung.
4. Reichen 20 px/m (Overview) aus, um einen Alarm durch KI zu verifizieren?
Nein. Bei 20 px/m besteht ein Mensch aus ca. 10 Pixeln. Weder ein Mensch noch eine KI kann hier zuverlässig zwischen einem Menschen und einem Tier unterscheiden, ohne eine hohe Fehlalarmrate zu produzieren. Diese Stufe dient nur der groben Situationserfassung („Da bewegt sich etwas“), nicht der Sicherheitsverifizierung.
5. Wie berechne ich die notwendige Auflösung für die Stufe „Validate“ (500 px/m)?
Die Formel lautet: Benötigte horizontale Pixel = Ziel-Pixeldichte (px/m) × Breite der Szene (m). Beispiel: Sie wollen eine 4 Meter breite Toreinfahrt überwachen und Personen validieren (500 px/m). Rechnung: 500 px/m × 4 m = 2000 Pixel. Sie benötigen also eine Kamera mit mindestens 2000 horizontalen Pixeln, eine Full-HD Kamera mit 1920 Pixeln wäre knapp zu wenig, eine 4MP oder 5MP Kamera wäre ideal.
6. Was bedeuten LPDO und HPDO?
LPDO (Low Pixel Density Object) fasst die niedrigen Qualitätsstufen (Overview, Outline, Discern) zusammen, die für die Überwachung weiter Flächen und Detektion genutzt werden. HPDO (High Pixel Density Object) umfasst die hohen Stufen (Perceive bis Scrutinise), die für die Erkennung von Details, Personenidentifizierung und forensische Beweise nötig sind. Diese Unterscheidung hilft Planern, die richtige Kameratechnik (Weitwinkel vs. Tele/Nahbereich) für den jeweiligen Zweck zu wählen.
9. Disclaimer
Dieser Bericht dient ausschließlich der allgemeinen Information und stellt keine verbindliche Rechts- oder Technikberatung dar. Die Inhalte basieren auf der Analyse der Norm IEC 62676-4:2025 und öffentlich zugänglichen Informationen zum Zeitpunkt der Erstellung. Normen unterliegen Urheberrechten und nationalen Anpassungen (z. B. DIN EN).
Für die konkrete Planung, Ausschreibung und Errichtung von Sicherheitsanlagen ist zwingend die Konsultation eines zertifizierten Fachplaners sowie die Einsichtnahme in die originalen Normtexte (erhältlich bei den entsprechenden Standardisierungsorganisationen wie IEC, CENELEC oder nationalen Verlagen wie Beuth/VDE) erforderlich. Der Autor übernimmt keine Haftung für Planungsfehler, Kostenkalkulationen oder Sicherheitslücken, die auf Basis der hier dargestellten Zusammenfassungen und Meinungen entstehen. Die Einschätzungen zur Wirtschaftlichkeit und technischen Umsetzbarkeit (insbesondere zu 1500 px/m) spiegeln die professionelle Meinung des Autors basierend auf dem aktuellen Stand der Technik wider.
Wenn Sie Unterstützung bei der fachgerechten Bewertung, Planung oder Umsetzung Ihrer Videoüberwachung benötigen, stehen wir Ihnen gerne zur Seite. Nehmen Sie unverbindlich Kontakt mit uns auf, wir beraten Sie kompetent und praxisorientiert.
NUTZUNG | HAFTUNG
Trotz sorgfältiger Kontrolle übernehmen wir keine Gewähr für die Richtigkeit und Vollständigkeit der Inhalte.