2 Das Datenmodell in der Geoinformatik
2.1 Begriffe und Definitionen
Geographische Informationsysteme zeichnen sich durch ihr weites Anwendungsgebiet aus (vgl. Tabelle 1). Dies hat zur Folge, daß die zum Teil erheblich voneinander abweichenden Ansprüche und Verwendungsarten zu unterschiedlichen Belegungen des Begriffes „GIS“ führen.
Tabelle 1: GIS-Anwendungsgebiete - Synonyme
Bodeninformationssystem Datawarehouse-Informationssystem Geo-Informationssystem Geologisches Informationssystem Historisches (Geo-) Informationssystem Hochwasserinformationssystem Landinformationssystem Landschaftsinformationssystem Leitungsinformationssystem Marketinginformationssystem Ökologisches Informationssystem Raumbezogenes Informationssystem Rauminformationssystem Raumordnungsinformationssystem Regionales Informationssystem Regionalstatstisches Informationssystem Topographisch-kartographisches Informationssystem Umweltinformationssystem Verkehrsleitinformationssystem |
Quelle: SWIACZNY/OTT 1999, S. 76
BILL/FRITSCH (1994) liefern eine Definition, die zum einen die Komponenten eines GIS als auch dessen Funktionen in der raumbezogenen Informationsverarbeitung erfaßt:
„Ein Geo-Informationssystem ist eine rechnergestütztes System, das aus Hardware, Software, Daten und den Anwendungen besteht. Mit ihm können raumbezogene Daten digital erfaßt und redigiert, gespeichert und reorganisiert, modelliert und analysiert sowie alphanumerisch und graphisch präsentiert werden.“ (BILL/ FRITSCH 1994, S. 5)
Folglich kann man unter einem GIS sowohl ein konkretes GIS-Projekt verstehen, z.B. in Form eines kommunalen technischen Informationssystems, als auch die eigentliche Software. Eine stärker an der Software orientierte Definition stammt von WILKINSON u.a. (1986):
„A Geographic Information System (GIS) can be defined as a system containing a spatial database representing aspects of the cultural and physical environment of a particular geographic region together with procedures for analysing combinations of attributes and generating graphical or statistical products.“ (WILKINSON u.a. 1986, S. 1-1, zitiert nach SAURER/ BEHR 1997, S. 10)
Demnach können unter funktionalen Aspekten vier Einheiten eines GIS voneinander abgegrenzt werden: die Dateneingabe, die Datenverwaltung , die Datenmanipulation sowie die Präsentation, wobei die Datenverwaltung nochmals in die Unterbereiche Datenmodellierung, Datenstrukturierung und Datenspeicherung zu unterscheiden ist (SHEKHAR u.a 1997, S. 154; LEIBERICH 1997 S.8).
Abbildung 1: GIS-Funktionsbereiche
Quelle: Nach LIEBIG 1997, S. 10, verändert
Aus den oben gegebenen Definitionen und der Darstellung in Abbildung 1 kann abgeleitet werden, daß der Datenverwaltung in einem GIS eine zentrale Bedeutung zukommt. Die Qualität dieser Komponente besitzt entscheidenden Einfluß darauf, wie aus einem Datenbestand innerhalb eines Informationssystem höherwertige Informationen abgeleitet werden können. Wie wichtig eine adäquate Datenmodellierung ist, zeigt sich auch in der Kostenstruktur eines GIS-Projektes. Hier wird die Kostenrelation zwischen Hardware, Software und Daten mit 2:3:10 angegeben. Ein ähnliches Bild liefert die Gültigkeitsdauer der einzelnen Komponenten (vgl. Tabelle 2), so daß hiermit diese Bedeutung nur unterstrichen werden kann (BILL/ FRITSCH 1994, S.3f.).
Tabelle 2: Gültigkeitsdauer für Komponenten von Informationssystemen
Hardware |
3-5 Jahre |
Software |
7-15 Jahre |
Daten |
25-70 Jahre |
Quelle: BILL/ FRITSCH 1994, S. 4
Die vorliegende Arbeit beschäftigt sich mit dem Thema „GIS“ in erster Linie unter dem Aspekt der Datenverwaltung, d.h. GIS wird hier in erster Linie als ein räumliches Datenbanksystem aufgefaßt. Als räumliche Datenbanksysteme bezeichnet man die spezielle Fom von Datenbankmanagementsystemen, die in ihrem Datenmodell und ihrer Abfragesprache räumliche Datentypen, wie Punkte, Linien und Polygone, anbieten, sowie effiziente Strategien zur Verarbeitung dieser Typen in ihrer Implementierung bereitstellen. Dies betrifft vorrangig die räumliche Indizierung der Daten, so daß Selektionen und Join-Operationen anhand räumlicher Eigenschaften durchgeführt werden können (GÜTING 1988, S. 507).
Die verwendete Terminologie in der GIS-Literatur zur Beschreibung räumlicher Phänomene in der Realwelt als auch ihre Repräsentation in einem Informationssystem ist äußerst uneinheitlich. Häufig wird das Begriffspaar „Feature“ und „Objekt“ zur Abgrenzung zwischen Realwelt und Datum verwendet (ANSI 1997a, S.7), andere Quellen bezeichnen mit „Geoobjekt“ sowohl die realen als auch die in einem GIS abgebildeten räumlichen Bezugseinheiten, während „Feature“ einen Eintrag in der Datenbank bezeichnet (LANGE 1997, S. 15ff.). Die Terminologie gewinnt an Komplexität, wenn der zeitliche Bezug Berücksichtigung findet. LANGRAN (1992, S. 48ff.) unterscheidet hier zwischen Objekten, die durch ihre Position im Raum definiert sind und deren nicht-räumlichen Attribute variieren, sowie Features, die anhand ihrer Identität festgelegt werden und deren Form und Position sich im Zeitablauf ändern können. Demnach sind Features einer thematischen Ebene zuzuordnen, während Objekte vorrangig durch ihre temporal-geometrische Komponente fixiert sind. VOIGTMANN (1997, S. 50f.) folgt prinzipiell dieser Argumentation, verwendet die beiden Begriffe aber genau umgekehrt.
In der vorliegenden Arbeit soll folgende Terminologie verwendet werden: Entitäten bzw. Entities sind Dinge der Realwelt, die einzeln identifiziert und anhand bestimmter Eigenschaften charakterisiert werden können, sowie für die Bearbeitung einer geographischen Fragestellung von Bedeutung sind. Die Entitäten können wiederum aus anderen Entitäten zusammengesetzt sein, diese Komponenten müssen aber von einer anderen Art sein. Beispielsweise ist ein Haus nicht in mehrere Häuser aufteilbar, aber es kann in Räume unterteilt werden. Dabei müssen Entitäten nicht zwangsläufig dinglicher Natur sein, sondern können ebenfalls abstrakte Begriffe wie z.B. Vorgänge oder Prozesse darstellen. Features sind die digitale Repräsentation dieser Entities in einem GIS und werden durch ihre Attributwerte beschrieben. Besitzen Features einen räumlichen Bezug, so wird dieser durch Geo-Objekte dargestellt. Geo-Objekte beschreiben Ausschnitte eines Gesamtraumes (z.B. der Erdoberfläche) und werden bei Bedarf explizit in räumliche Objekte ohne zeitliche Festlegung und räumlich-temporale Objekte unterschieden.
2.2 Der allgemeine Modellbegriff
Modelle dienen in den Wissenschaften dazu, durch Strukturierung und Reduktion die Informationsfülle der Umwelt handhabbar zu machen ( HAKE/ GRÜNREICH 1994, S. 14). STACHOWIAK (1965, S. 438) sieht folgende charakteristischen Merkmale eines Modells:
-
Modell als Abbildung: Modelle repräsentieren natürliche oder künstliche Originale, wobei das Original seinerseits schon ein Modell sein kann.
-
Modell als Vereinfachung: Bei der Modellbildung wird gezielt eine Verkürzung durchgeführt, indem bestimmte Eigenschaften als relevant eingestuft werden, während andere Eigenschaften nicht in das Modell einfließen.
-
Modell als subjektive Pragmatik: Bereits die Verkürzung drückt aus, daß der Inhalt eines Modells davon abhängt, was als relevant, d.h. nach einer subjektiven Auswahl, für das Original angenommen wird. Abhängig von beteiligten Personen, Zeitpunkten und Thematiken kann ein System in unterschiedliche Modelle münden.
Der allgemeine Modellbegriff muß insbesondere in empirischen Wissenschaften wie der Geographie dahingehend eingeengt werden, daß die Qualität des Modells anhand empirischer Befunde überprüfbar sein muß ( HAKE/ GRÜNREICH 1994, S. 15).
Die Originale, die ein Modell darstellt, werden nach der Allgemeinen Systemtheorie als Systeme aufgefaßt:
Ein System ist eine Gesamtheit von Elementen, zwischen denen und zwischen deren Attributen (Eigenschaften) wechselseitige Beziehungen tatsächlich bestehen oder gegebenenfalls hergestellt werden können (WIRTH 1979, S. 105).
Diese Definition impliziert, daß Systeme selbst schon eine Interpretation der realen Welt sind, in der vor allem strukturelle und funktionale Aspekte betrachtet werden. Bezogen auf die Geographie unterscheidet WIRTH (1979, S. 106) zwischen nicht-räumlichen Systemen, Systemen mit räumlichen Aspekten und räumlichen Systemen. Während erstere keinen Raumbezug aufweisen, lassen sich Systeme mit räumlichen Aspekten unter anderem anhand ihrer Verortung beschreiben (z.B. soziale und ökonomische Systeme, die gewisse Standorte oder Verbreitungsareale besitzen). Räumliche Systeme hingegen sind aufgrund ihrer räumlichen Eigenschaften definiert, und das Funktionieren des Systems hängt wesentlich von den räumlichen Beziehungen der Systemelemente ab. Insbesondere die räumliche Distanz zwischen den Systemelementen determiniert die gegenseitigen Beziehungen (WIRTH 1979, S. 106 f).
Formal betrachtet ist die Modellbildung eine Funktion, die ein System auf ein anderes abbildet, wobei einige der Strukturen erhalten bleiben. In dem vereinfachten Modell können diese Strukturen analysiert und die Ergebnisse im Ausgangssystem interpretiert werden. Dabei sind die wichtigsten qualitativen Eigenschaften des Modells, wie wirklichkeitsgetreu die Abbildung erfolgt, und in welchem Umfang die aus dem Modell gewonnenen Erkenntnisse auf das Original übertragbar sind (WORBOYS 1995, S. 146; KOOY 1994, S. 1217).
Abbildung 2: Modellfunktion
Quelle: WORBOYS 1995, S. 146
2.3 Sichtweisen des Datenmodells
2.3.1 Datenmodell als Algebra
Der Begriff des Datenmodells ist in der Informatik so definiert, daß darin Modellierungskonstrukte festgelegt werden, mit deren Hilfe innerhalb eines computergestützten Informationssystems ein Abbild der realen Welt generiert werden kann. Es bietet die Möglichkeit, Entitäten zu beschreiben und legt die anwendbaren Operatoren sowie deren Wirkung fest (KEMPER/EICKLER 1996, S. 19). Die auf relationale Datenbanksysteme angewendete Form stammt von CODD (1970) und umfaßt drei Elemente (LEE 1995, S. 4):
-
Eine Auswahl an Objekten, die die grundlegenden Elemente bilden
-
Eine Auswahl an Operatoren, mit denen Daten manipuliert werden können
-
Eine Auswahl an Integritätsbedingungen, die die Gültigkeit der Daten sicherstellt.
Nach dieser Auffassung kann ein Datenmodell mit einer Algebra verglichen werden, da es aus einer Elementmenge, einer Operationenmenge und Regeln, die die Ergebnisse dieser Operationen definieren, aufgebaut ist (KEMPER/EICKLER 1996, S. 976). Demnach liefert ein Datenmodell die „Infrastruktur“ für die Modellierung der realen Welt und konzentriert sich dabei auf die Abstraktion von Daten. Übertragen auf den GIS-Bereich bedeutet dies, daß ein räumliches Datenmodell eine umfassende Menge an konzeptionellen Werkzeugen bereitstellt, mit deren Hilfe räumliche Daten strukturiert werden können. Dabei werden die Daten beschrieben und die passenden Operationen festgelegt, ohne die Details der Implementierung zu beschreiben (FRANK/ EGENHOFER 1992, S. 976; FRANK/ MARK 1991, S.149).
Die Funktion des Datenmodells im Bereich der Datenbanken besteht darin, Komplexität vor dem Anwender zu verbergen und die eigentliche interne Realisierung zu abstrahieren. Logische Datenmodelle wie das Relationale Modell beschreiben auf einer abstrakten Ebene, wie der Benutzer seine Daten organisieren kann. Wie dies technisch über entsprechende Datenstrukturen realisiert ist, kann zwischen verschiedenen Systemen variieren. Hier dient das Datenmodell als Definition einer Schnittstelle, über die der Anwender Daten verwaltet und manipuliert. Diese standardisierte Schnittstelle ermöglicht die Portabilität auf verschiedene Hard- und Software-Plattformen, da die logische Sicht auf Daten und die konkrete Umsetzung voneinander entkoppelt sind (FRANK 1992, S. 410; EGENHOFER/ HERRING 1991, S. 229).
2.3.2 Datenmodell als Abstraktion der Realwelt
In der GIS-Literatur wird diese Definition dahingehend erweitert, daß ein Datenmodell ein Abbild der Realwelt in einem GIS darstellt, das durch Daten gebildet wird. Beispielsweise definiert GOODCHILD ein Datenmodell als „a limited representation of reality, constrained by the finite, discrete nature of computing devices.“ (GOODCHILD 1992, S. 401). Dabei wird deutlich, daß die Vereinfachung des Modells in einem EDV-gestützten Informationssystem auch dadurch bedingt ist, daß in einem Rechner alle Elemente in endlicher und diskretisierter Form vorliegen müssen, da Computer formale Systeme sind, die Symbole entsprechend formaler Regeln behandeln (FRANK/ EGENHOFER 1992, S. 976; BITTNER/ FRANK 1997, S.12; HERRING 1992, S. 445).
Die Qualität eines Datenmodells und der darin enthaltenen Datenstrukturen läßt sich mit Hilfe mehrerer Kriterien bestimmen. Die Gewichtung der einzelnen Kriterien variiert dabei in Abhängigkeit des Anwendungszwecks (PEUQUET 1990, S. 258):
-
Vollständigkeit: wie umfassend werden Entitäten und ihre Beziehungen untereinander erfaßt.
-
Robustheit: bis zu welchem Grad kann das Modell mit Sonderfällen umgehen (z.B. können Polygone mit Löchern gebildet werden).
-
Flexibilität: welcher Aufwand ist nötig, das Datenmodell an geänderte Bedingungen anzupassen.
-
Effizienz: wie kompakt können Geo-Objekte dargestellt werden (Speichereffizienz) und wie wirkt sich die Art ihrer Repräsentation auf die Gesamtperformanz der Anwendung aus.
-
Handhabbarkeit: wie groß ist der Aufwand, Daten in diesem Modell aufzubauen.
Beispielsweise würde man bei der Implementierung einer Klimasimulation großen Wert darauf legen, daß das Datenmodell die beeinflussenden Größen möglichst präzise erfaßt und dafür Abstriche bei der Effizienz machen. Bei einem Gewerbeflächen-Auskunftssystem, das über das Internet erreichbar sein soll, hätte die Effizienz oberste Priorität, um den „Flaschenhals“ der Datenübertragung auszugleichen, während die geometrische Detailliertheit nachrangig wäre.
In der GIS-Praxis ist zu berücksichtigen, daß zwischen der Realwelt und dem Datenmodell in einem GIS noch andere, häufig analoge Zwischenstufen wie Karten oder Luftbilder stehen. Insbesondere thematische Karten stellen gefilterte und abstrahierte Informationen der Realwelt dar, die durch die Digitalisierung in das GIS übertragen werden (GOODCHILD 1992, S. 402).
2.4 Modellebenen in Informationssystemen
Der Prozeß, mit dem ein Abbild der Realität in einem Informationssystem erstellt wird, kann auf unterschiedlichen Ebenen betrachtet werden, ausgehend von der Realwelt über mehrere Stufen der Abstraktion bis hin zur physischen Speicherstruktur im Rechner (PEUQUET 1990, S. 252). Dieses Standardschema zur Datenmodellierung in digitalen Informationssystemen geht zurück auf das American National Standards Institute, Standards Planning and Requirements Committee (ANSI-SPARC) und stellt inzwischen einen allgemein anerkannten Standard dar (LAURINI/ THOMPSON 1992, S. 351).
Abbildung 3: Modellebenen nach ANSI – SPARC
Quelle: Nach LAURINI/ THOMPSON 1992, verändert
Externe Ebene
Den Ausgangspunkt bildet ein Ausschnitt der Realwelt, der im Informationssystem abgebildet werden soll. Davon extrahieren potentielle Anwender die sie interessierenden Inhalte und formulieren daraus ein externes Modell, das ihre Sicht repräsentiert. Auf dieser Stufe steht vor allem das Thema des Anwenders im Vordergrund (LAURINI/ THOMPSON 1992, S. 357).
Konzeptionelle Ebene
Auf der konzeptionellen Ebene erfolgt eine Synthese der externen Modelle, und es wird eine Abstraktion erarbeitet, die die in der Realwelt als relevant eingestuften Entitäten und ihre Beziehungen untereinander repräsentiert. Angestrebt wird eine möglichst präzise Abbildung der fachlichen Inhalte in einer vereinheitlichten, leicht verständlichen Form, um damit eventuelle Fehlinterpretationen aufzudecken (LAURINI/ THOMPSON 1992, S. 360; KELLER 1999, S. 50). Gerade vor dem Hintergrund der Verständlichkeit haben sich hierzu verschiedene visuell orientierten Methoden entwickelt, wie beispielsweise das Entity-Relationship-Modell (ERM) (CHEN 1976) oder die Object Modeling Technique (OMT) (RUMBOUGH u.a. 1993).
Abbildung 4: Beispiel für ein ERM-Diagramm
Quelle: TRYFONA/ HADZILACOS 1997, S.8
Einerseits wird eine möglichst formale Beschreibung angestrebt, andererseits soll eine Abhängigkeit von einer bestimmten Implementierungsstrategie vermieden werden. Dadurch soll das fachspezifische Wissen und ihre informationstechnische Umsetzung voneinander entkoppelt werden. Diese Trennung ist in der Praxis von großer Bedeutung, da sich Softwaretechnologien rasch entwickeln und verändern, während Fachkonzepte als langlebig einzustufen sind, und damit auch auf nachfolgende Techniken anwendbar bleiben. Da sich diese Ebene mit der Modellierung von Begriffen und der Bedeutung dieser Begriffe für den Anwender beschäftigt, wird dieser Abschnitt auch als semantische Modellierung der Realität bezeichnet (SCHEER 1995, S. 175).
Bevor ein logisches Datenmodell für ein räumliches Informationssystem aufgestellt werden kann, gilt es, für das Anwendungsgebiet eine operationale Basis zu finden. Dies trifft insbesondere für die Abbildung realer Systeme zu, da hier das zusätzliche Problem besteht, daß diese durch unterschiedliche Anwender in unterschiedlicher Weise aufgefaßt werden können. Im Gegensatz dazu sind beispielsweise betriebliche Informationssysteme in der Regel im Vorhinein durch externe Modelle festgelegt, indem etwa Organisationen bereits in strukturell festgelegter Form (Geschäftsführer – Bereichsleiter - Abteilungsleiter – Sachbearbeiter) beschrieben sind. Insofern bedarf es für ein GIS eines nachvollziehbaren konzeptionellen Modells, das unterschiedliche räumliche Wahrnehmungen integriert (FRANK 1992, S. 411).
Logische Ebene
Das konzeptionelle Modell ist aber in dieser Form meist nicht als Implementationsschema geeignet, da es sich in der Regel um reine Beschreibungsmodelle mit graphischer Notation handelt, deren Zweck darin besteht, die reale Welt möglichst anschaulich abzubilden. Deshalb werden auf der logischen Ebene die Konzepte in die vom verwendeten Software-System angebotenen Strukturen überführt (LAURINI/ THOMPSON 1992, S. 361).Der Übergang zum logischen Modell ist ein intellektueller Prozeß, der zwar von den zur Verfügung stehenden Modellierungshilfen wie dem ERM methodisch geleitet werden kann, aber nicht immer zwangsläufig zum selben Ergebnis führen muß. Die einfließenden persönlichen Parameter wie Erfahrung oder unterschiedliche Präferenzen (z.B. Redundanzfreiheit versus Performanz) bedingen, daß es nicht das eine „korrekte“ Datenmodell gibt, sondern mehrere für das Anwendungsproblem adäquate Lösungen möglich sind (SCHEER 1995, 46; SCHNEIDER 1995, S. 15). Die Unterscheidung in eine konzeptionelle und eine logische Ebene ist insofern von Bedeutung, als sie die unterschiedlichen Sichten auf den Prozeß der Datenmodellierung unterstreicht. Das konzeptionelle Modell drückt das Verständnis und die fachliche Kompetenz des Anwenders aus und betont die semantischen Aspekte des Informationssystems, die das Wissen über die Realwelt beinhaltet. Im logischen Modell wird die Sicht der Informatik auf die Datenmodellierung betont, indem formal definierte Elemente die Basis zur Modellierung bilden (DAVID/ RAYNAL/ SCHORTER 1993, S. 266f.).
Interne Ebene
Diese Ebene beschreibt, wie die Daten physikalisch auf einem Datenträger organisiert werden. Diese Ebene ist normalerweise nicht zugänglich für einen Datenbankanwender (LAURINI/ THOMPSON 1992, S. 362).
2.5 Besonderheiten geographischer Daten
Die Besonderheiten, die die Verarbeitung geographischer Daten von der aus anderen Disziplinen wie der Betriebswirtschaft unterscheiden, lassen sich auf zwei Ebenen festmachen:
-
Räumlich gebundene Informationen an sich beinhalten Eigenschaften, wie sie in anderen Bereichen nicht anzutreffen sind und erfordern deshalb besondere Konzepte, um sie adäquat abzubilden. Diese Betrachtungsebene ist zunächst völlig unabhängig von einer Umsetzung in ein GIS, sondern betrifft die Informationsverarbeitung in der Geographie als solche. Die Darstellung in Form einer analogen Karte ist nur eine Möglichkeit, räumliche Gegebenheiten zu modellieren, und GIS kann in diesem Zusammenhang als eine durch die Verfügbarkeit einer neuen Technologie ermöglichte Adaption bekannter Techniken interpretiert werden.
-
In der informationstechnischen Sicht erfordern geographische Daten vor allem aufgrund ihrer Komplexität besondere Implementierungsstrategien, die sie deutlich von konventionellen Informationssystemen unterscheiden.
Eine wichtige Eigenschaft geographischer Daten ist ihre gegenseitige räumliche Abhängigkeit oder, wie von TOBLER formuliert: „all things are related but nearby things are more related than distant things.“ (TOBLER 1970, zitiert nach LONGLEY u.a. 1999, S. 7). Dieser Umstand wird in der Geostatistik unter dem Begriff „spatial autocorrelation“ diskutiert (GOODCHILD 1992, S. 402). Einzelne thematische Aspekte einer Landschaft weisen häufig eine hohe Korrelation auf, so daß sie nicht isoliert voneinander gesehen werden können. In diesem Zusammenhang muß die Arbeitsweise in einem Layer-GIS, einen Raumausschnitt in einzelne thematische Bereiche zu untergliedern, immer vor dem Hintergrund gesehen werden, daß damit die Komplexität reduziert wird und nicht unabhängige Variablen separiert werden (LONGLEY u.a. 1999, S. 8).
Aus systemtheoretischer Sicht stellen räumliche Daten Fakten über räumliche Systeme dar. Dabei sind folgende Besonderheiten festzuhalten (WIRTH 1979, S. 119f.):
-
Räumliche Systeme sind probabilistische Systeme: Insbesondere Modelle aus dem Bereich der physischen Geographie bilden Systeme ab, bei denen die Elemente und deren Beziehungen nicht immer vollständig bekannt sind, und das Modell dient dazu, diese Unsicherheit zu bewältigen.
-
Räumliche Systeme sind komplexe Systeme: Die Komplexität geographischer Fragestellungen äußert sich quantitativ in der hohen Zahl involvierter Elemente und Beziehungen, als auch qualitativ in den ausgeprägten Rückkopplungsmechanismen innerhalb der Beziehungen (WIRTH 1979, S. 119f.). In diesem Zusammenhang kann das länderkundliche Schema nach HETTNER 1932 als eine Methode gedeutet werden, diese Komplexität im Sinne einer Modellierung zu reduzieren und die Sichtweise zunächst auf einzelne Aspekte zu begrenzen. Erst nach der Zerlegung werden die Verbindungen der einzelnen thematischen Aspekte beispielsweise in Form von Ursache und Wirkung wieder hergestellt (z.B. Einfluß der geologischen Bedingungen auf Böden, agrarische Nutzung der Böden, bestimmte Flurformen infolge einer spezifischen Nutzung)
-
Räumliche Systeme sind dynamische Systeme: Räumliche Systeme verändern sich im Zeitablauf. Dies betrifft sowohl die Beziehungen der Elemente untereinander als auch die Systemelemente selbst.
Aus der Sicht der Informatik stellen raumbezogene Daten eine Nicht-Standardanwendung von Datenbankmanagementsystemen dar. Unter Standardanwendungen versteht man die Verwaltung von administrativen Informationen (Personal-, Lohn- und Kundenwesen usw.) wohingegen z.B. CAD und GIS zu den Nicht-Standardanwendungen zu zählen sind (BILL 1991, S. 48f.; vgl. Tabelle 3).
Tabelle 3: Vergleich Standard- und Nicht-Standardanwendungen von DBMS
Standardanwendungen |
Nicht-Standardanwendungen |
Feste Anzahl Attribute/Objekt |
Variable Anzahl Attribute/Objekt |
Einfach strukturierte Daten |
Komplexe Datenstrukturen |
Eindimensionale Schlüssel |
Mehrdimensionale Schlüssel |
Vorhersagbarkeit der Länge von Attributen und Tupeln |
Variabilität der Länge von Attributen und Tupeln |
Exakter Match |
Unsicherer Match |
Einige logische Verknüpfungen |
Vielfache logische Verknüpfungen |
Leichte Operatoren |
Komplexe Operatoren |
Kurze, unteilbare Transaktionen auf wenigen Entitäten |
Lange Transaktionen auf viele Entitäten |
Quelle: BILL 1991, S. 49
Die Daten der sog. Standardanwendungen wie Applikationen im kaufmännischen Bereich sind in der Regel einfach strukturierte Datensätze, die nur wenig Speicherplatz benötigen und die Beziehungen zwischen den Datensätzen sind einfacher Natur. Räumliche Daten zeichnen sich durch ihre komplexe Struktur aus, wobei der Grad der Komplexität variiert. Die geometrische Repräsentation eines räumlichen Objekts kann einmal ein einzelner Punkt sein, während andere Entitäten durch mehrere Polygone dargestellt werden müssen. Dabei kann jedes Polygon aus mehreren hundert Punkten bestehen oder Löcher besitzen (GÜNTHER 1998, S. 51).
Die Geometriedaten in räumlichen Datenbanken benötigen umfangreichen Speicherplatz. Obwohl die technologische Entwicklung auf dem Hard- und Softwaresektor in den letzten Jahren deutliche Fortschritte erzielen konnte, erfordert das Datenvolumen besondere Strategien in der Programmierung, um effizient mit räumlichen Daten umgehen zu können. Dies wird noch dadurch verstärkt, daß mehrere Dimensionen zu berücksichtigen sind. Die Mehrdimensionalität räumlicher Daten bewirkt, daß Abfragen anhand der räumlichen Eigenschaften ungleich aufwendiger sind als auf eindimensionalen Attributen in Standardanwendungen (GÜNTHER 1998, S. 51).
Über die reine Bewältigung der Datenmenge hinaus stellen sich bei der Handhabung geographischer Informationen auch methodische Probleme. So besteht keine Standardalgebra für räumliche Daten. Dies bedeutet, daß keine einheitlich definierten räumlichen Operatoren in den unterschiedlichen Systemen zur Verfügung stehen, sondern der jeweilige spezielle Anwendungszweck zu unterschiedlichen Ausprägungen führt. Darüberhinaus sind viele räumliche Operatoren nicht abgeschlossen. Beispielsweise kann der Schnitt zweier Polygone in einem Vektorsystem zu unterschiedlichen geometrischen Ergebnissen führen: einzelne Punkte, gemeinsame Randlinien oder wiederum Polygone. Diese Problematik ist insbesondere dann von Bedeutung, wenn Operatoren miteinander verknüpft werden sollen (GÜNTHER 1998, S. 51).
© 2014 Zeit in Geografischen Informationssystemen (GIS), Frank Hellwich