L2: Räumliche Datenmodelle - Skript¶

2.1 Einführung räumliche Datenmodelle (Spatial Data Models)¶

Wie wird die reale Welt in einem Geographischen Informationssystem (GIS) abgebildet? Diese Frage steht am Beginn jeder Beschäftigung mit räumlichen Datenmodellen. Wenn man ein Luftbild betrachtet - etwa eine Landschaft mit Wiesen, Wäldern, Gebäuden und Straßen - sieht man die Welt so, wie sie ist: komplex, detailreich und ohne klare digitale Struktur.

Die Aufgabe eines räumlichen Datenmodells (Spatial Data Model) besteht darin, diese komplexe Realität so in den Computer zu übertragen, dass sie dort gespeichert, abgefragt und analysiert werden kann. Dabei gibt es einen grundlegenden Unterschied in der Art, wie geographische Phänomene auftreten.

Geographische Entitäten, die als Flächen konzipiert sind, lassen sich in zwei Kategorien einteilen. Diskrete Daten haben eine klar definierte räumliche Ausdehnung mit scharfen Grenzen. Ein typisches Beispiel sind Verwaltungseinheiten: Ein Bundesland hat eine exakte Grenze, und die Bevölkerungsdichte pro Zählungsblockgruppe ist eindeutig einem abgegrenzten Gebiet zugeordnet. Auf der Slide sieht man das als farblich getrennte Regionen einer Karte.

Kontinuierliche Daten hingegen variieren gleichmäßig über den Raum, ohne scharfe Grenzen. Temperatur, Höhe oder Niederschlag ändern sich fließend - es gibt keinen Punkt, an dem die Höhe abrupt von einem Wert auf einen anderen springt. Auf der Slide wird das durch ein Hillshade-Bild (Schummerung) veranschaulicht, in dem Geländeformen als kontinuierliche Oberfläche dargestellt werden.

Aus dieser Unterscheidung ergeben sich die zwei grundlegenden Datenmodelle der Geoinformatik. Das Rasterdatenmodell eignet sich besonders gut für kontinuierliche Daten. Es legt ein gleichmäßiges Gitter über die Landschaft, und jede Zelle dieses Gitters speichert einen Wert - etwa eine Höhe oder eine Temperatur. Das Vektordatenmodell eignet sich besonders gut für diskrete Daten. Es beschreibt geographische Objekte durch Punkte, Linien und Polygone - also durch geometrische Formen mit exakten Koordinaten. Ganz unten auf der Slide sieht man die reale Welt als Ausgangspunkt: eine Landschaft mit einem See, Bäumen, verschiedenen Bodentypen. Das Vektormodell abstrahiert diese Landschaft in benannte Flächen ("Grassland", "Lake", "Marsh"), während das Rastermodell dieselbe Landschaft als Gitter mit farbcodierten Zellen darstellt. Beide Modelle bilden dieselbe Realität ab, aber auf fundamental unterschiedliche Weise.

2.2 Vektordatenmodell (Vector Data Model)¶

Das Vektordatenmodell ist eines der zwei zentralen Datenmodelle in der Geoinformatik und dient dazu, diskrete thematische Merkmale zu organisieren - also Objekte mit klar definierten Grenzen wie Straßen, Küstenlinien, Gebäude oder Verwaltungsgrenzen.

Feature Classes¶

Der Softwarehersteller Esri, dessen Produkt ArcGIS Pro in dieser Lehrveranstaltung verwendet wird, bezeichnet Vektordaten als Feature Classes. Eine Feature Class ist eine homogene Sammlung von Features, die alle dieselbe räumliche Repräsentation teilen und einen gemeinsamen Satz von Attributspalten besitzen. Das bedeutet konkret: Eine Feature Class enthält entweder nur Punkte, nur Linien oder nur Polygone, niemals eine Mischung davon.

Die vier am häufigsten verwendeten Typen von Feature Classes sind Punkte (Points), Linien (Lines), Polygone (Polygons) und Annotationen (Annotations). Punkte repräsentieren Objekte ohne räumliche Ausdehnung im gegebenen Maßstab, etwa Messstationen, Berggipfel oder Hydranten. Linien repräsentieren Objekte mit Länge, aber ohne relevante Breite, wie Straßenmittellinien, Flüsse oder Leitungstrassen. Polygone repräsentieren flächenhafte Objekte wie Grundstücke, Seen oder Gebäudeumrisse. Annotationen sind eine spezielle Feature Class für Kartentext, also Beschriftungen, die an einer bestimmten Position platziert werden.

Auf der Slide sieht man diese vier Typen nebeneinander auf einem Kartenausschnitt: Points als Symbole an Kreuzungen, Lines als grüne Straßenverläufe, Polygons als beige Flächen und Annotation als Straßennamen wie "Anderson Dr" oder "Essex Dr".

Features und Attribute¶

Ein einzelnes Objekt innerhalb einer Feature Class wird als Feature bezeichnet. Ein Feature ist ein Objekt, dessen geographische Repräsentation - in der Regel als Punkt, Linie oder Polygon - zusammen mit seinen beschreibenden Eigenschaften in einer Zeile einer Tabelle gespeichert wird. Diese Eigenschaften werden als Attribute bezeichnet.

Vektordaten haben zwei wesentliche Vorteile. Erstens haben sie einen kompakten Speicherbedarf, weil nur die tatsächlichen Koordinaten der Objekte gespeichert werden und nicht, wie beim Rastermodell, ein flächendeckendes Gitter. Zweitens können mit einem Feature eine unbegrenzte Anzahl von Attributen verknüpft werden. Ein einzelner Hydrant kann beispielsweise gleichzeitig Informationen über das Installationsdatum, den Düsendurchmesser, den Wassertyp und den Wartungsstatus tragen.

Attributtabelle (Attribute Table)¶

Die Attributtabelle (Attribute Table) ist die Grundlage der geographischen Features im Vektormodell. Tabellarische Informationen ermöglichen es, die Daten zu visualisieren, abzufragen und zu analysieren. Bei Vektordaten sind die Attributdatensätze mit den Punkt-, Linien- und Polygonfeatures verknüpft. Jedes Feature kann mehrere Attribute tragen, und jedes Vektor-Feature ist durch eine eindeutige Feature-Nummer (FID, Feature ID) mit seinen Attributen verknüpft.

In ArcGIS-Umgebungen werden die Zeilen einer Attributtabelle als Datensätze (Records) und die Spalten als Felder (Fields) bezeichnet. Auf der Slide sieht man eine typische Attributtabelle mit den Feldern FID, Shape, ID_0, ISO, NAME_0 und weiteren. Jede Zeile entspricht einem Feature - hier den Verwaltungseinheiten Österreichs. Die Spalte "Shape" enthält den Geometrietyp (Polygon), und die weiteren Spalten enthalten beschreibende Attribute wie Ländername, Bundesland und Gemeindename. Rechts auf der Slide sieht man das Attribute-Panel eines einzelnen Features, beispielsweise eines Hydranten, mit Feldern wie "Install Date", "Nozzle Diameter", "Lifecycle Status" und "Water Type".

2.3 Übung: Feature Classes erstellen¶

In der praktischen Übung wird gezeigt, wie man in ArcGIS Pro eine Feature Class erstellt. Der Dialog "Create Feature Class" verlangt die Angabe eines Namens und eines Feature Class Type (Geometry Type). Die verfügbaren Geometrietypen umfassen Polygon, Line, Point, Multipatch, Multipoint, 3D Object, Annotation und Dimension.

Im Geoprocessing-Tool "Create Feature Class" werden zusätzliche Parameter festgelegt: die Feature Class Location (also der Speicherort, z.B. eine GeoPackage-Datenbank), der Name, der Geometrietyp sowie optionale Einstellungen wie "Has M" (Messwerte), "Has Z" (Höhenwerte), das Koordinatensystem und ein Alias.

Rechts auf der Slide sieht man das Geoprocessing-Tool "Create SQLite Database", mit dem eine GeoPackage-Datenbank (Spatial Type: GeoPackage 1.4) angelegt werden kann. GeoPackage ist ein offenes, dateibasiertes Format auf Basis von SQLite, das als universeller Container für räumliche Daten dient.

2.4 Rasterdatenmodell (Raster Data Model)¶

Das Rasterdatenmodell ist das zweite grundlegende Datenmodell in der Geoinformatik. Während das Vektormodell einzelne Objekte mit Koordinaten beschreibt, verfolgt das Rastermodell einen völlig anderen Ansatz.

Aufbau eines Rasters¶

In seiner einfachsten Form besteht ein Raster aus einer Matrix von Pixeln (oder Zellen), die in Zeilen und Spalten (oder als Gitter) angeordnet sind. Jedes Pixel enthält genau einen Wert, der eine Information darstellt - zum Beispiel die Bildreflexion (bei Satellitenbildern) oder die Temperatur (bei Klimadaten). Auf der Slide sieht man links eine schematische Darstellung: Ein Baum in einer Landschaft wird als dreidimensionales Gitter überlagert, wobei jede Zelle einen Wert speichert. Rechts sieht man eine Geländeoberfläche, die als Raster mit Höhenwerten und Höhenlinien dargestellt wird.

Rasterdaten stammen aus verschiedenen Quellen: digitale Bilder, die durch Luftfahrzeuge, Drohnen oder Satelliten erfasst wurden, Sensoren am Boden und im Wasser, sowie gescannte Karten.

Kontinuierliche und thematische Rasterdaten¶

Daten, die im Raster-Format gespeichert sind, stellen Ausschnitte der Wirklichkeit auf zwei verschiedene Weisen dar. Kontinuierliche Daten (Continuous Data) sind Spektraldaten wie Satelliten-, Luft- und Drohnenbilder sowie physische und Umweltdaten wie Höhe und Temperatur. Bei kontinuierlichen Rasterdaten repräsentiert jedes Pixel einen Messwert, der sich graduell zu den Nachbarzellen ändert.

Thematische Daten (auch diskontinuierliche Daten genannt) repräsentieren dagegen kategorische Features wie Landnutzung und Bodendaten. Hier steht jeder Pixelwert nicht für eine Messung, sondern für eine Klasse - beispielsweise "Wald", "Acker" oder "Siedlung".

Anwendungen von Rasterdaten¶

Bild- und Rasterdaten werden in einem GIS in der Regel für drei Zwecke eingesetzt. Erstens dienen Bilder als Grundkarten (Basemaps): Orthophotos oder Satellitenbilder werden als Hintergrund verwendet, auf dem andere Daten wie Straßen oder Verwaltungsgrenzen überlagert werden. Auf der Slide sieht man ein Luftbild eines Stadtgebiets mit gelb markierten Straßen als Beispiel.

Zweitens werden Raster als Oberflächenkarten (Surface Maps) eingesetzt. Höhenmodelle oder Temperaturfelder stellen kontinuierliche Oberflächen dar, hier als farbcodiertes Geländemodell mit Höhenstufen von Grün über Gelb bis Rosa sichtbar.

Drittens dienen Raster als thematische Karten: Landnutzungsklassifikationen oder Bodenkarten weisen jedem Pixel eine Kategorie zu. Links auf der Slide sieht man eine Landbedeckungsklassifikation mit Klassen wie Agriculture, Bare Ground, Water, Deciduous, Grass, Pine, Shadow und Urban/Developed.

Geographische Eigenschaften eines Rasters¶

Damit ein Raster geographisch verortet werden kann, besitzt jedes Bild-Dataset vier grundlegende geographische Eigenschaften. Erstens ein Koordinatensystem (Coordinate System), das definiert, wie die Pixel-Positionen auf die Erdoberfläche abgebildet werden. Zweitens eine Referenz-Koordinate oder XY-Position, die üblicherweise die obere oder untere linke Ecke des Bildes festlegt. Drittens eine Pixelgröße (Cell Size), die bestimmt, welche Fläche am Boden ein einzelnes Pixel abdeckt. Viertens die Zeilen- und Spaltenanzahl (Rows and Columns), die die Dimension des Rasters festlegt.

Auf der Slide sieht man links den Image Space (Bildraum): eine Matrix aus farbigen Zellen, angeordnet in Zeilen (Rows) und Spalten (Columns), hier jeweils 8. Rechts der Coordinate Space (Koordinatenraum): Dieselbe Matrix, aber jetzt mit einer geographischen Position (Grid Location XY) und einer definierten Zellgröße (Cell Size). Unten sieht man, dass sich alle Zellwerte als fortlaufende Liste speichern lassen - die räumliche Struktur ergibt sich aus der bekannten Zeilen- und Spaltenanzahl.

Vorteile der Rasterspeicherung¶

Das Rasterformat bietet mehrere Vorteile. Es hat eine einfache Datenstruktur: Eine Matrix aus Pixeln mit Werten, die jeweils eine Koordinatenposition besitzen und mit einer Attributtabelle verknüpft sein können. Es ist ein leistungsfähiges Format für erweiterte räumliche und statistische Analysen, weil mathematische Operationen (Addition, Multiplikation, Vergleich) direkt zellenweise durchgeführt werden können. Es bietet die Möglichkeit, kontinuierliche Bilddaten und Oberflächen darzustellen und wissenschaftliche Analysen durchzuführen. Und es ermöglicht, Punkte, Linien, Polygone und Flächen einheitlich zu speichern - im Gegensatz zum Vektormodell, das für jeden Geometrietyp eine eigene Feature Class benötigt.

2.5 Übung: Räumliche Datenmodelle erkunden¶

In der abschließenden Übung werden alle vier Geometrietypen (Punkt, Linie, Polygon, Raster) anhand realer Daten erkundet. Die Daten stammen vom österreichischen Open-Data-Portal data.gv.at und beziehen sich auf das Land Salzburg.

Als Punkt-Layer werden die Gipfel des Landes Salzburg geladen. Als Linien-Layer dient das Gewässernetz des Landes Salzburg - Flüsse und Bäche, dargestellt als Linien-Features. Als Polygon-Layer werden die Verwaltungsgrenzen Salzburgs verwendet, also die flächenhaften Grenzen von Gemeinden oder Bezirken. Und als Raster-Layer kommt die digitale Schummerung (Hillshade) des Landes Salzburg in einer Auflösung von 100 Metern zum Einsatz.

Auf der Slide sieht man rechts die Suchoberfläche von data.gv.at mit dem Suchbegriff "vgd salzburg", die einen Treffer für "Verwaltungsgrenzen (VGD) - Stichtagsdaten Salzburg" liefert. Diese Übung verbindet das theoretische Wissen über Vektor- und Rasterdatenmodelle mit der praktischen Arbeit in ArcGIS Pro.