L3: Signaturen - Skript¶

3.1 Grundlagen der Signaturen (Symbology)¶

In einem Geographischen Informationssystem (GIS) reicht es nicht, Daten nur zu speichern und zu analysieren. Die Ergebnisse müssen auch visuell kommuniziert werden, und genau dafür braucht man Signaturen (englisch Symbology). Eine Signatur ist die grafische Darstellung eines geographischen Features auf einer Karte. Sie codiert Informationen visuell, damit der Kartenleser qualitative und quantitative Beziehungen auf einen Blick erfassen kann.

Wichtig ist die sprachliche Unterscheidung: Im Deutschen wird oft von "Symbol" gesprochen, doch der englische Fachbegriff lautet Symbology für das Gesamtkonzept der Signaturierung. Das deutsche Wort "Symbol" und das englische "Symbol" sind dabei nicht deckungsgleich. Im GIS-Kontext meint Symbology das gesamte System, mit dem Features auf der Karte dargestellt werden, während ein einzelnes Symbol nur ein konkretes grafisches Zeichen ist. In ArcGIS Pro findet man die Signaturierung über Rechtsklick auf einen Layer und dann den Menüpunkt "Symbology". Dort stehen verschiedene Darstellungsarten zur Auswahl: Single Symbol (ein einziges Symbol für alle Features), Unique Values (Kategorisierung nach Attributwerten), Graduated Colors (abgestufte Farben für quantitative Daten), Bivariate Colors, Unclassed Colors und Graduated Symbols.

Signaturen beschreiben, kategorisieren oder ranken geographische Features. Damit dienen sie drei Zwecken: Sie können qualitative Unterschiede zeigen (z.B. verschiedene Landnutzungstypen durch verschiedene Farben), quantitative Unterschiede ausdrücken (z.B. Bevölkerungsdichte durch Farbintensität) oder eine Rangordnung kommunizieren (z.B. Straßenklassen durch Linienstärke).

Jeder Geometrietyp hat seine eigenen Signatureigenschaften. Bei Polygon-Features kann man die Füllfarbe (Color), die Umrissfarbe (Outline Color) und die Umrissstärke (Outline Width) anpassen. Linien-Features haben die Eigenschaften Farbe (Color) und Linienstärke (Line Width). Punkt-Features bieten die meisten Einstellungsmöglichkeiten: Neben dem Shape Fill Symbol mit Füllfarbe, Umrissfarbe und Umrissstärke können auch Größe (Size), Winkel (Angle), Halo, Winkelausrichtung (Angle Alignment, nur im 2D-Kontext), Billboard (nur im 3D-Kontext) und Rotationsreihenfolge (Rotation Order, nur im 3D-Kontext) eingestellt werden. Zusätzlich gibt es den Geometrietyp Mesh, der nur die Eigenschaft Farbe besitzt und für 3D-Oberflächen verwendet wird.

Signaturen können also als Codierung von Karten-Features zur Übermittlung von Bedeutung verstanden werden. Sie sollen klar, präzise und für jeden leicht verständlich sein. Bei der Wahl der Signatur ist eine sorgfältige Auswahl entscheidend, denn eine schlecht gewählte Darstellung kann die Botschaft der Karte verfälschen oder unverständlich machen. Die richtige Signatur verstärkt die Aussage, die falsche verschleiert sie.

3.2 Visuelle Variablen (Visual Variables)¶

Die Frage, wie genau man Signaturen gestaltet, führt zum Konzept der visuellen Variablen (Visual Variables). Jacques Bertin hat in den 1960er Jahren ein System von visuellen Variablen definiert, das bis heute die Grundlage der kartographischen Gestaltung bildet. In ArcGIS Pro werden neun visuelle Variablen unterschieden, die je nach Geometrietyp unterschiedlich einsetzbar sind.

Der Abstand (Spacing) beschreibt die Dichte von Mustern oder Elementen. Bei Punkten können Symbole enger oder weiter gestreut werden, bei Linien variiert der Abstand zwischen Strichmustern, bei Flächen ändert sich die Musterfrequenz. Diese Variable funktioniert sowohl in 2.5D als auch in echtem 3D.

Die Größe (Size) ist eine der intuitivsten Variablen. Größere Punkte stehen für höhere Werte, dickere Linien für wichtigere Straßen, größere Flächenmuster für höhere Intensitäten. Größe eignet sich hervorragend für quantitative Daten, weil der Mensch Größenunterschiede gut intuitiv erfassen kann.

Die perspektivische Höhe (Perspective Height) nutzt die dritte Dimension, um Werte darzustellen. Bei Punkten werden z.B. Säulen unterschiedlicher Höhe gezeigt, bei Flächen dreidimensionale Blöcke. In echtem 3D ist perspektivische Höhe allerdings nicht möglich, da dort die Höhe bereits durch die tatsächliche Position im Raum bestimmt wird.

Die Ausrichtung (Orientation) dreht Symbole in verschiedene Richtungen. Pfeile können z.B. Windrichtungen anzeigen. Für Flächen ist Ausrichtung als visuelle Variable nicht empfohlen, weil die Orientierung eines Flächenmusters schwer ablesbar ist. In 2.5D ist Ausrichtung ebenfalls nicht empfohlen.

Shape (Form) unterscheidet Features durch verschiedene Symbolformen, z.B. Kreis für Städte, Dreieck für Berge, Kreuz für Kirchen. Shape eignet sich gut für qualitative, kategoriale Daten. Für Flächen wird Shape nicht empfohlen, in 2.5D ebenfalls nicht.

Der Wert (Value) bezeichnet die Helligkeit bzw. den Grauwert eines Symbols, von Schwarz über Graustufen bis Weiß. Diese Variable eignet sich für geordnete, quantitative Daten: Dunklere Töne werden intuitiv als "mehr" wahrgenommen.

Der Farbton (Hue) ist die eigentliche Farbe, also ob etwas Rot, Blau, Grün oder Gelb ist. Farbtöne eignen sich hervorragend für qualitative, kategoriale Unterscheidungen. Verschiedene Landnutzungstypen durch verschiedene Farben darzustellen, ist ein klassisches Beispiel. Der Farbton funktioniert in allen Dimensionen, von Punkt über Linie und Fläche bis 2.5D und 3D.

Die Helligkeit (Lightness) variiert, wie hell oder dunkel ein Farbton erscheint. Eine Choroplethenkarte, die Bevölkerungsdichte zeigt, nutzt typischerweise einen Farbton (z.B. Blau) in unterschiedlichen Helligkeitsstufen.

Die Sättigung (Saturation) bestimmt, wie kräftig oder blass eine Farbe wirkt. Ein stark gesättigtes Rot ist ein leuchtend reines Rot, ein ungesättigtes Rot wirkt grau-rosa. Sättigung kann als zusätzliche Dimension genutzt werden, ist aber subtiler als Farbton oder Helligkeit.

An dieser Stelle ist ein wichtiger Exkurs zu 2.5D vs. 3D nötig, weil dieser Unterschied in der Praxis und in Prüfungen relevant ist. Ein 2.5D-Modell hat die Eigenschaft der planaren Eindeutigkeit: An jedem Punkt (x, y) gibt es genau einen z-Wert. Das bedeutet, dass Geländeüberhänge nicht dargestellt werden können, denn an einem Geländeüberhang gäbe es für dieselbe (x, y)-Position mehrere Höhenwerte übereinander. Typische Digitale Geländemodelle (DGM) sind 2.5D. Ein echtes 3D-Modell erlaubt dagegen mehrere z-Werte pro (x, y)-Position, kann also Überhänge, Höhlen oder Brücken darstellen. Auf Slide 5 ist rechts eine Grafik, die diesen Unterschied veranschaulicht: Oben sieht man einen Geländeüberhang in 3D mit vertikal mehreren z-Werten, unten dasselbe Gelände in 2.5D, wo der Überhang "plattgedrückt" wird und nur ein z-Wert pro Position erlaubt ist.

3.3 Klassifikationsmethoden (Classification Methods)¶

Wenn quantitative Daten auf einer Karte dargestellt werden sollen, müssen die kontinuierlichen Werte in diskrete Klassen eingeteilt werden. Jede Klasse bekommt dann eine eigene Farbe oder ein eigenes Symbol. Die Wahl der Klassifikationsmethode hat einen enormen Einfluss auf die Aussage der Karte. Dieselben Daten können, je nach Methode, völlig unterschiedliche räumliche Muster suggerieren. ArcGIS Pro bietet sieben Standardmethoden an.

Natural Breaks (Jenks)¶

Die Natural Breaks-Methode, auch Jenks-Optimierung genannt, ist die Standardmethode in ArcGIS Pro und in den meisten Fällen eine gute erste Wahl. Der Algorithmus untersucht die sortierten Datenwerte und setzt die Klassengrenzen automatisch an natürlichen Lücken in den Daten. Das bedeutet: Dort, wo im Datensatz ein deutlicher Sprung zwischen aufeinanderfolgenden Werten auftritt, wird eine Klassengrenze gesetzt.

Mathematisch funktioniert das so: Der Jenks-Algorithmus minimiert die Varianz innerhalb jeder Klasse (die Werte innerhalb einer Klasse sollen möglichst ähnlich sein) und maximiert gleichzeitig die Varianz zwischen den Klassen (die Klassen sollen sich möglichst stark voneinander unterscheiden). Das Ergebnis ist eine Klasseneinteilung, die die tatsächliche Struktur der Daten gut widerspiegelt.

Natural Breaks ist geeignet, wenn man die tatsächlichen Muster in den Daten sichtbar machen will, ohne eine bestimmte Verteilungsannahme vorauszusetzen. Sie funktioniert gut bei Daten mit unregelmäßigen Verteilungen und deutlichen Häufungsgruppen.

Der Nachteil: Die Klassengrenzen sind oft "krumme Zahlen" (z.B. 347.8 statt 350), was die Legende schwer lesbar macht. Außerdem ändern sich die Klassengrenzen, wenn sich die Daten ändern. Damit sind Karten, die mit Natural Breaks erstellt wurden, nicht gut für Vergleiche über die Zeit geeignet, weil zwei Karten unterschiedlicher Zeitpunkte unterschiedliche Klassengrenzen haben.

Quantile¶

Bei der Quantile-Methode wird jede Klasse so gebildet, dass sie gleich viele Objekte enthält. Wenn man z.B. 100 Gemeinden in 5 Klassen einteilt, enthält jede Klasse genau 20 Gemeinden. Die Werteintervalle der Klassen sind dabei unterschiedlich breit: In Bereichen, in denen viele Werte dicht beieinander liegen, sind die Intervalle schmal. In Bereichen mit wenigen, weit gestreuten Werten sind sie breit.

Quantile ist besonders gut geeignet, wenn eine gleichmäßige Farbverteilung auf der Karte erwünscht ist. Da jede Klasse gleich viele Features enthält, werden alle Farben der Legende in etwa gleich häufig auf der Karte vorkommen. Die Karte wirkt dadurch visuell ausgewogen und vermeidet das Problem, dass eine Farbe dominiert.

Die Methode eignet sich gut, wenn die genauen Intervallgrenzen weniger wichtig sind als der Gesamteindruck der räumlichen Verteilung. Sie ist besonders nützlich für ordinal skalierte Daten oder wenn man Rangfolgen visualisieren will.

Der Nachteil: Objekte mit sehr ähnlichen Werten können in verschiedene Klassen fallen, während Objekte mit sehr unterschiedlichen Werten in derselben Klasse landen. Wenn z.B. viele Gemeinden eine ähnliche Bevölkerungsdichte haben, werden einige davon willkürlich in die nächsthöhere Klasse verschoben, nur um die gleiche Anzahl pro Klasse zu erreichen. Das kann irreführend sein.

Equal Interval¶

Die Equal Interval-Methode teilt den gesamten Wertebereich in gleich breite Intervalle. Wenn die Werte von 0 bis 100 reichen und 5 Klassen gewünscht sind, entsteht 0-20, 20-40, 40-60, 60-80, 80-100. Jede Klasse umfasst einen gleich großen Wertebereich, aber die Anzahl der Objekte pro Klasse variiert.

Equal Interval ist die richtige Wahl, wenn gleiche Abstände auch inhaltlich gleich bedeutsam sind. Das klassische Beispiel ist Temperatur: Der Unterschied zwischen 10 Grad Celsius und 20 Grad Celsius ist genauso bedeutsam wie zwischen 20 Grad Celsius und 30 Grad Celsius. Auch für Prozentangaben (0-100%) oder andere Daten mit gleichmäßiger Verteilung ist diese Methode gut geeignet.

Die Methode funktioniert am besten bei gleichmäßig verteilten Daten. Das Problem tritt bei schiefen Verteilungen auf: Wenn z.B. die meisten Gemeinden eine Bevölkerungsdichte zwischen 0 und 200 haben, aber einige wenige Ausreißer bei 2000 liegen, dann enthält die höchste Klasse fast keine Gemeinden, während die unterste Klasse fast alle enthält. Die Karte zeigt dann kaum Farbvariation, weil fast alles in einer Klasse landet.

Defined Interval¶

Bei Defined Interval gibt der Nutzer die Intervallbreite selbst vor. Man entscheidet z.B., dass jede Klasse genau 10 km2 breit sein soll, oder genau 1000 Einwohner umfassen soll. Die Anzahl der entstehenden Klassen ergibt sich dann automatisch aus dem Wertebereich der Daten geteilt durch die vorgegebene Intervallbreite.

Diese Methode ist ideal, wenn fachlich sinnvolle, runde Intervallgrenzen gewünscht sind. Höhenklassen alle 500 Meter, Einkommensklassen alle 10 000 Euro oder Entfernungsklassen alle 10 Kilometer ergeben inhaltlich sinnvolle und leicht kommunizierbare Klassengrenzen. Die Anzahl der resultierenden Klassen ist dabei zweitrangig.

Der Nachteil: Man hat keine direkte Kontrolle über die Anzahl der Klassen. Bei einem großen Wertebereich und kleiner Intervallbreite können sehr viele Klassen entstehen, was die Legende unübersichtlich macht. Außerdem kann die Verteilung der Objekte auf die Klassen sehr ungleichmäßig sein.

Manual Interval¶

Manual Interval gibt dem Nutzer die vollständige Kontrolle: Die Klassengrenzen werden komplett manuell gesetzt. Man kann jede einzelne Grenze frei wählen, um die Einteilung exakt an die Fragestellung anzupassen.

Diese Methode ist ideal, wenn inhaltliches Vorwissen über die Daten besteht. Gesetzliche Grenzwerte (z.B. Feinstaubbelastung: unter 25, 25-50, über 50 Mikrogramm pro Kubikmeter), politische Schwellenwerte oder etablierte Klassifikationen aus der Fachliteratur können so exakt abgebildet werden. In der Praxis wird Manual Interval oft so eingesetzt, dass man zuerst eine andere Methode (z.B. Natural Breaks) anwendet und die Grenzen anschließend feinjustiert, um sie runder oder inhaltlich sinnvoller zu machen.

Der Nachteil: Die Methode erfordert Fachwissen und Urteilsvermögen. Ohne inhaltliche Begründung für die Klassengrenzen besteht die Gefahr, die Daten bewusst oder unbewusst in eine gewünschte Richtung zu verzerren.

Geometric Interval¶

Die Geometric Interval-Methode basiert auf einer geometrischen Reihe: Die Klassenbreiten werden nach oben hin progressiv größer. Die erste Klasse könnte z.B. den Bereich 0-10 umfassen, die zweite 10-30, die dritte 30-90 usw. Jede Klasse ist um einen konstanten Faktor breiter als die vorherige.

Diese Methode ist speziell für schiefe Verteilungen konzipiert, also Daten, bei denen viele kleine Werte und wenige sehr große Werte vorkommen. Typische Beispiele sind Einkommensdaten, Bevölkerungszahlen oder Grundstückspreise. Bei solchen rechtsschiefen Verteilungen versagen Equal Interval und oft auch Natural Breaks, weil sie die vielen kleinen Werte nicht ausreichend differenzieren.

Geometric Interval erzeugt eine annähernd gleiche Klassenbreite und eine konsistente Häufigkeit pro Klasse. Das bedeutet, dass sowohl die vielen kleinen Werte als auch die wenigen großen Werte differenziert dargestellt werden. Die Karte zeigt dadurch mehr Farbvariation als bei Equal Interval.

Typische Prüfungsfrage: "Welche Klassifikationsmethode wählen Sie für rechtsschief verteilte Bevölkerungsdichte?" Die Antwort lautet Geometric Interval, weil diese Methode die vielen Gemeinden mit geringer Dichte differenziert und gleichzeitig die wenigen Großstädte mit hoher Dichte in eigene Klassen fasst.

Der Nachteil: Die Klassengrenzen sind für den Laien schwer nachvollziehbar, weil sie einer mathematischen Reihe folgen und keine "runden" Zahlen ergeben.

Standard Deviation¶

Die Standard Deviation-Methode (Standardabweichung) setzt die Klassengrenzen relativ zum Mittelwert der Daten. Die Klassen werden bei +-1 Sigma, +-2 Sigma usw. vom Mittelwert gebildet. Eine typische Klasseneinteilung wäre: unter -2 Sigma, -2 Sigma bis -1 Sigma, -1 Sigma bis Mittelwert, Mittelwert bis +1 Sigma, +1 Sigma bis +2 Sigma, über +2 Sigma.

Diese Methode zeigt nicht den absoluten Wert, sondern wie stark Werte vom Durchschnitt abweichen. Sie ist ideal, wenn genau das die Fragestellung ist: "Welche Gemeinden haben eine überdurchschnittliche Arbeitslosenquote? Welche liegen unter dem Durchschnitt?" Auf der Karte fällt sofort auf, wo Ausreißer liegen.

Die Methode setzt eine Normalverteilung der Daten voraus. Nur dann verteilen sich die Objekte symmetrisch um den Mittelwert, und die Klassen enthalten sinnvolle Anteile der Daten. Bei stark schiefen Verteilungen ist Standard Deviation ungeeignet, weil dann fast alle Werte in einer oder zwei Klassen liegen und die Karte kaum Variation zeigt.

Der Nachteil: Die Absolutwerte gehen verloren. Der Kartenleser sieht nur, ob ein Wert über oder unter dem Durchschnitt liegt, aber nicht, wie hoch der Wert tatsächlich ist. Außerdem ist die Interpretation für Laien schwieriger, weil das Konzept der Standardabweichung nicht allgemein bekannt ist.

Zusammenfassung der Klassifikationsmethoden¶

Für die Praxis und die Prüfung lohnt es sich, die sieben Methoden im Vergleich zu kennen:

Methode	Klassenbreite	Objekte pro Klasse	Beste Datenverteilung	Typischer Einsatz
Natural Breaks (Jenks)	ungleich	ungleich	beliebig, mit Lücken	explorative Analyse, Default
Quantile	ungleich	gleich	beliebig	gleichmäßige Farbverteilung
Equal Interval	gleich	ungleich	gleichmäßig	Temperatur, Prozent
Defined Interval	gleich (vorgegeben)	ungleich	beliebig	fachlich runde Grenzen
Manual Interval	frei wählbar	ungleich	beliebig	gesetzliche Grenzwerte
Geometric Interval	geometrisch steigend	annähernd gleich	rechtsschief	Einkommen, Bevölkerung
Standard Deviation	gleich (in Sigma)	ungleich	Normalverteilung	Abweichung vom Mittelwert

3.4 Beschriftung (Labeling)¶

Neben der Signatur gibt es ein zweites wichtiges Gestaltungselement auf der Karte: die Beschriftung (Labeling). Während Signaturen Features visuell codieren, identifizieren Beschriftungen Features durch Text. Auf Slide 14 sieht man den Unterschied deutlich: Links im Contents-Panel die Signatur (die farbigen Symbole für jedes Land), rechts auf der Karte die Beschriftung (die Ländernamen wie "Germany", "Austria", "France").

Signatur und Beschriftung ergänzen sich. Die Signatur zeigt, was ein Feature ist oder welchen Wert es hat. Die Beschriftung zeigt, wie es heißt. Beide zusammen machen eine Karte lesbar.

In ArcGIS Pro werden Beschriftungen automatisch generiert und platziert. Dafür stehen zwei Engines zur Verfügung: die Standard-Labels und die Maplex Label Engine. Die Maplex Label Engine bietet erweiterte Platzierungsstrategien und ist über das Menü "More" im Labeling-Tab aktivierbar. Sie kann Labels überlagern lassen (Overrun), verkleinern (Reduce Size), abkürzen (Abbreviate), Schlüsselzahlen vergeben (Key Number) und Platzierungsstrategien priorisieren (Strategy Order). In den Map Properties unter "Labels" können allgemeine Einstellungen vorgenommen werden, z.B. die Farbe für nicht platzierte Labels (die also keinen Platz gefunden haben) oder die Orientierung vertikaler Labels.

Slide 16 zeigt die detaillierte Konfiguration im Labeling-Tab von ArcGIS Pro. Oben links sieht man die Label Class-Einstellungen: Man wählt das Feld (z.B. COUNTRY), das als Beschriftung dienen soll, und kann optional einen SQL-Query oder eine Expression definieren, um die Beschriftung zu filtern oder zu formatieren. Der Labeling-Tab in der Ribbon-Leiste bietet Einstellungen für Sichtbarkeitsbereich (Visibility Range), Textsymbol (Text Symbol) und Label-Platzierung (Label Placement).

Rechts auf Slide 16 sieht man das Placement-Panel der Label Class. Hier wird konfiguriert, wie Labels innerhalb oder außerhalb von Polygonen platziert werden. Optionen umfassen unter anderem Regular Placement, das Vermeiden von Löchern im Polygon (Avoid Holes in Polygon), die Ausrichtung (Horizontal in Polygon), Orientierung, Leader Line Anchor Points (Führungslinien zu kleinen Features) und Spread Labels (Beschriftungen über große Flächen verteilen). Diese Feineinstellungen sind entscheidend für eine saubere kartographische Darstellung, bei der sich Labels nicht überlappen und jedes Feature klar identifizierbar bleibt.