Home > Struktur > Diplomarbeit > 2 Internet und WWW > 2.4 Funktionsweise und Architektur
  

2.4 Funktionsweise und Architektur
 
Von allen Diensten wird in diesem Kapitel nur das WWW näher betrachtet. Was nun folgt ist eine Darstellung und Beschreibung der drei Standards im WWW sowie in weiterer Folge das Prinzip des Hypertextes.

2.4.1 Die drei Standards

2.4.1.1 HTML
HTML ist eine Beschreibungssprache in der beliebige Dokumente im WWW publiziert werden können. Das W3-Konsortium standardisierte aufgrund der schnellen Verbreitung des WWW HTML, wobei man sich am bereits bestehenden Standard SGML (Standard Generalized Markup Language) orientierte.
Das grundlegende Prinzip von Markup-Systemen ist, dass jedem Textstück mittels "Tags" ein Format zugeordnet werden kann. Der Web-Browser interpretiert den aus reinem ASCII-Text bestehenden HTML-Code und stellt das Dokument grafisch dar.

HTML-Dokumente können jedoch auch Grafiken oder andere Multimedia Dateien integrieren. Es besteht weiters die Möglichkeit, mittels Hypertext auf andere Dokumente zu verweisen.

2.4.1.2 HTTP
Das HTTP-Protokoll ist ein Kommunikationsprotokoll zur Übertragung von HTML-Dateien im Internet. Es ist ein zustandsloses Protokoll, das heißt, das jede HTTP Anforderung in einem Schritt beantwortet wird. Das Serversystem speichert keine Daten über bestehende oder im Aufbau befindliche Verbindungen.

2.4.1.3 URL
Mittels einer IP-Adresse wird jedes Objekt im Internet adressiert. Diese aus vier Zahlenkombinationen bestehende numerische Adresse wird mittels DNS (Domain Name System) in eine symbolische Adresse, die URL (Uniform Ressource Locator) umgewandelt.

Um eine eindeutige Bezeichnung des Zielobjekts zu erhalten, muss eine URL folgende drei Informationen beinhalten:
> Protokoll (HTTP, FTP,...)
> Internetadresse und Portnummer des Serversystems
> Pfad und Dateinamen

Die URL-Syntax ist im Internet Standard RFC 1738 spezifiziert
(Siehe: Berners-Lee et. al, 1994):

abb2 - 115352.1
Abb.2: Syntax einer URL

Eine URL wird direkt in die Adresszeile des Browsers eingegeben, was einen einfachen Zugang zur Information ermöglicht.

2.4.2 Prinzip des Hypertextes

2.4.2.1 Prinzip und Begriff
Das World Wide Web setzt auf dem Prinzip des Hypertextes auf, welches der Funktionsweise des menschlichen Gehirns sehr ähnlich ist. Man kann Informationen nichtlinear verfolgen, indem man auf sogenannte Hyperlinks (Schlüsselwörter) klickt. Hyperlinks können in HTML-Dokumente eingebettet werden, der (die) Leser(in) kann die Lesefolge selbst bestimmen.
Das Prinzip ist nicht unbedingt etwas Neues, die verzweigte "Hypertext-Struktur" kann man zum Beispiel in Lexika und Nachschlagewerken wiederfinden, wo mittels Stichworten auf andere Textstellen verwiesen wird. Innerhalb dieser Diplomarbeit wird beispielsweise ebenfalls auf andere Punkte verwiesen oder mit Fußnoten gearbeitet.

Den Begriff „Hypertext“ prägte Ted Nelson 1982, als er ein System Namens „Xanadu“ vorstellte. In seinem Buch „Literary Machines“ erklärte er, wie man Dokumente, die aus vernetzten Informationsknoten bestehen, erstellt. Das System wurde aber wegen des Fehlens technischer Möglichkeiten nie realisiert.
Das erste Hypertext-System wurde mit der Einführung des Apple Macintosh realisiert. Das Karteikartensystem „HyperCard“ ließ elektronische Verknüpfungen der einzelnen Karteikarten zu.

2.4.2.2 Probleme beim Verlinken
Jeder, der schon einmal im WWW gearbeitet hat, kennt „Error 404“-Meldung leider zu gut. Diese Meldungen tauchen auf, wenn die aufgerufene Webseite nicht mehr verfügbar ist. Abbildung 3 zeigt eine adaptierte („theatralische“) Version einer „Error 404“-Meldung der Frankfurter Oper.


abb3 - 115353.1
Abb.3: Beispiel einer Fehler 404 - Meldung

„URL is simply an address masquerading as an identifier.“ (Payette, 1998)
Das Problem beim Verlinken mit URLs ist die Ortsbezogenheit. Eine URL identifiziert nicht das Objekt selbst, sondern beschreibt nur eindeutig den Ort. Es kommt zu sogenannten "broken links", sollte das Dokument verschoben oder gelöscht worden sein. "It is important to recognize that URLs were never intended to be long-lasting names for content; they were designed to be flexible, easily implemented and easily extensible ways to make reference to materials on the Net." (Lynch, 1997)

2.4.2.3 Notwendigkeit neuer Konzepte
Die Notwendigkeit für neue Konzepte – Konzepte für “sichere Links” – wird duch die in Unterkapitel 2.4.2.2 geschilderte Fehlermeldung deutlich.Sogenannte „Unique Identifier“ oder „Persistent Identifier“ werden besonders im Bereich des wissenschaftlichen Arbeitens notwendig, um langfristigen und zuverlässigen Zugang zu Dokumenten und Informationen zu erhalten. Weiters müssen diese Dokumente eindeutig identifizierbar sein.

zurück - 115347.1 inhaltsverzeichnis - 115349.1 nächstes - 115348.1




Metainfo:
Autor: sebastian udulutsch; Copyright: Sebastian Udulutsch; Publiziert von: sebastian udulutsch (sebastian)
factID: 115104.4 (...Archiv); Publiziert am 25 Nov. 2002 18:27
 
Verknüpfungen:
Struktur  >  Diplomarbeit  >  2 Internet und WWW