Der Weg durchs Web

I. Kemmerzell


Nachdem die erste Euphorie über die Möglichkeiten des World Wide Webs vorüber ist, stellt sich bald wieder der Alltag des geplagten Studenten und der nicht minder gestreßten Wissenschaftlerin ein. Was nutzen Ihnen all die schönen Seiten, wenn Sie Lösungen für Ihr konkretes Problem suchen? Anhand eines Beispiels möchte ich Ihnen zeigen, wie eine themenorientierte Suche im WWW aussehen kann.

Um es gleich vorwegzunehmen, eine Encyclopaedia Internetica, die Ihnen sämtliche aktuell verfügbaren Informationsquellen im Internet zu einem Thema oder Stichwort liefert, gibt es nicht. Es bedarf auch keiner prophetischen Gabe um abzusehen, daß ein derartiges Werkzeug in Zukunft nicht erschaffen wird. Dies ist weniger auf die enormen technischen Erfordernisse (z.B. Kapazitäten der Speicher- bzw. Übertragungsmedien) zurückzuführen, sondern liegt insbesondere in den unterschiedlichen Interessen und Zielsetzungen der Informationsanbieter und -nachfrager begründet.

Dennoch gibt es eine Reihe von Werkzeugen, die eine strukturierte Suche nach Informationsquellen im Internet ermöglichen. Da fast alle Dienste im Internet mittlerweile über das World Wide Web verfügbar sind, werde ich mich hier auf dieses Medium beschränken. Kernpunkt bilden auch hier wieder die URLs (Uniform Resource Locators), deren Bedeutung und Nutzung ich in der letzten INKUERZE erläutert habe.

Bevor Sie sich auf die Suche begeben, sollten Sie zuvor unbedingt vermeiden, daß sämtliche Inline-Grafiken bei Ihrer Recherche übertragen werden. Zu Präsentationszwecken mögen sie sinnvoll sein, bei einer Recherche sind sie unnötiger Balast. Schalten Sie dazu in Ihrem Mosaic-Browser die Option ''Inline Images'' in der Kartei ''General'' ab, die Sie über den Menüeintrag ''Options/Preferences ...'' erreichen.

Nehmen wir nun an, Sie suchen Informationen über den Verfall des Dollars an den internationalen Devisenmärkten in den letzten Wochen. Ein guter Ansatzpunkt für eine derartige Suche bieten thematisch orientierte Listen, die z.B. von Scott Yanoff (University of Wisconsin) oder vom W3-Konsortium angeboten werden. Eine wöchentlich aktualisierte Kopie von Yanoffs Liste stellen wir unter

http://www.ku-eichstaett.de/docs/inet.services.html

zur Verfügung, der entsprechende URL vom W3-Konsortium lautet

http://www.w3.org/hypertext/DataSources/bySubject/Overview.html

Sie finden beide Einträge übrigens im Menüpunkt ''Explorer'' unserer Mosaic-Installation. In Yanoffs Liste befindet sich im Abschnitt ''BUSINESS/ECONOMICS/FINANCIAL'' unter der Rubrik ''Currency Exchange Rates'' ein Verweis auf

gopher://catisuf.csufresno.edu/00/atls/rates

das Ihnen eine (nicht ganz aktuelle) Übersicht der Dollar-basierten Wechselkurse zeigt. Unbedingt lohnenswert ist ein Blick auf das an der University of Michigan beheimatete Economic Bulletin Board, das m.W. die weltweit größte Sammlung unentgeltlich verfügbarer volkswirschaftlicher Daten im Internet bietet. Als Einstiegspunkt bietet sich

gopher://una.hh.lib.umich.edu/11/ebb

an.

Wenn Sie in einem Verzeichnis eine Datei oder einen Katalog namens ''README'' o.ä. finden, sollten Sie unbedingt dieser Aufforderung Folge leisten. Danach bietet sich beispielsweise eine Stichwortsuche über den Menüpunkt ''Keyword Search of File Titles'' an. Naheliegend ist hier etwa die Eingabe von

exchange rate

als Suchbegriff. Nach kurzer Zeit erhalten Sie die zu diesem Index gehörenden ''Treffer''. Möglicherweise überrascht es Sie nun, in diesem Zusammenhang auch Arbeitslosenstatistiken zu finden, die offensichtlich sachlich nicht mit dem angegebenen Suchbegriff korrespondieren. Bei näherer Betrachtung erkennt man, daß alle ''Treffer'' mindestens eines der verwendeten Worte in Ihrem Titel enthalten. Dies ist auf das zugrundeliegende WAIS-Protokoll zurückzuführen, das die durch mindestens ein Leerzeichen getrennten Begriffe standardmäßig mit einem logischen ODER verknüpft. Wenn Sie dagegen die Syntax

exchange AND rate

verwenden, werden alle indizierten Dokumente angezeigt, deren Titel die Begriffe ''exchange'' und ''rate'' enthalten.

Allerdings werden Sie auch hier meist auf statistisches Datenmaterial stoßen, Hintergrundinformationen über aktuelle wirschaftliche Entwicklungen dürften eher die Ausnahme sein. Ferner werden nur diejenigen Dokumente gefunden, die das bezeichnete Suchmuster im Titel enthalten. Nützlicher wäre hier natürlich eine Indizierung nach in Titel und Textteil vorkommenden Schlüsselwörtern.

Zurück zu Yanoffs Liste: Hinter der Bezeichnung ''FINWeb A Financial Economics WWW Server'' bietet James R. Garven, Assistant Professor am Department of Finance der University of Texas in Austin, das zu diesem Fachgebiet vielleicht umfangreichste und äußerst gut strukturierte Informationsangebot im Web an:

http://riskweb.bus.utexas.edu/finweb.html

Weiteres Stöbern lohnt sich für Interessierte hier sicherlich. Thematisch ähnlich orientiert ist

http://www.cob.ohio-state.edu/dept/fin/overview.htm

Sie finden es beispielsweise in der Liste des W3-Konsortiums (s.o.) unter ''Finance''.

Last, but not least sei hier auf die Wall-Street-News verwiesen, die sich bereits seit einiger Zeit im WWW tummelt. Sie finden sie unter

http://wall-street-news.com/forecasts/index.html

Zu den meisten Themengebieten im Internet existieren Zusammenstellungen über sogenannte Frequently Asked Questions (kurz: FAQ), ein Begriff, der keiner weiteren Erläuterung oder Übersetzung bedarf. Für unser Problem könnte sich daher ein Blick in die ebenfalls in Yanoffs Liste aufgeführten FAQs der ''Economics Resources on the Web'' über

http://econwpa.wustl.edu/EconFAQ/EconFAQ.html

lohnen.

Neben den beiden genannten Listen bietet etwa der Global Network Navigator (GNN) unter der Rubrik ''Whole Internet Catalog'' einen umfangreichen Überblick. Da das Informationsangebot auf den deutschen Servern

http://www.germany.eu.net/gnn/wic/index.html

bzw.

http://www.tu-chemnitz.de/gnn/wic/index.html

gespiegelt wird, sollten Sie darauf verzichten, den Original-Server in den Staaten

(http://gnn.com/)
zu kontaktieren.

Neben den Listen stellen sogenannte Roboter oder Search Engines eine zweite Klasse von Hilfsmitteln - im Web-Jargon werden sie als ''Navigationshilfen'' bezeichnet - zur Informationssuche dar. Im Unterschied zu Listen ist dabei eine direkte Abfrage nach Suchbegriffen möglich.

Eines der bekannteren zu dieser Klasse gehörenden Werkzeuge ist dabei der World Wide Web Worm (WWWW) von Oliver McBryan (University of Colorado):

http://www.cs.colorado.edu/home/mcbryan/WWWW.html

McBryans Wurm bedient sich - wie die meisten Suchprogramme - eines Formulars zur Auswahl einer geeigneten Suchmethodik. Unter ''Select'' müssen Sie dabei angeben, welche Datenbestände zugrunde gelegt werden sollen. Bei der ersten Variante (Search all Citation Hypertext) werden alle sogenannten Anker, das sind die mit einem Hyperlink verbundenen Textstellen, die normalerweise im Browser blau dargestellt werden, verwendet. Der zweite Menüpunkt ''Speed'' legt fest, wie die eingegebenen Suchbegriffe verknüpft bzw. interpretiert werden. Schließlich können Sie die Anzahl der maximal angezeigten Treffer auswählen. Genauere Erläuterungen und Beispiele finden Sie unter

http://www.cs.colorado.edu/home/mcbryan/WWWWintro.html

Neben dem WWWW sind der WWW-Wanderer http://www.netgen.com/search.html) von Matthew Gray, Yahoo Search (http://www.yahoo.com/search.html) sowie Lycos an der Carnegie Mellon University (http://lycos.cs.cmu.edu/) weitere nützliche Anlaufstellen. Neben Umfang und Aktualität der zugrundeliegenden Datenbestände unterscheiden sich diese Werkzeuge auch hinsichtlich der Variabilität und Handhabung der Suchmethoden zum Teil erheblich. Eine generelle Empfehlung kann ich Ihnen nicht geben, der Nutzen hängt wesentlich vom Einzelfall ab. Häufig steckt der Teufel im Detail: McBryans WWWW etwa läßt derzeit lediglich 25 Anfragen zu, so daß Sie allenfalls morgens oder vormittags erfolgreich recherchieren können. Einen umfangreicheren Überblick der Suchhilfen finden Sie in [1].

Nun habe ich Ihnen zwar eine Reihe von Einstiegshilfen und Instrumenten für eine Informationsrecherche im Web vorgestellt, allerdings sind wir bei der Suche nach Dokumenten in unserem Beispielfall mit Ausnahme statistischen Datenmaterials noch nicht allzu erfolgreich gewesen. Im wirklichen Leben würden wir dazu sicherlich einige Tages- oder Wochenzeitungen zu Rate ziehen, warum also nicht auch im Web? Ein rechte brauchbare Übersicht dazu bietet das Clausthaler ELSTER-Team unter

http://www.rz.tu-clausthal.de/elster/Kiosk/kom-zeitungen-d.html

an. Dort finden Sie beispielsweise den Electronic Telegraph (http://www.telegraph.co.uk/), bei dem Sie allerdings zunächst eine Registriernummer beantragen müssen, bevor Sie ihn benutzen können. Danach stehen Ihnen nicht nur ein recht umfangreicher Auszug der täglichen Nachrichten zur Verfügung, sondern mit dem ET Archive auch die zurückliegenden Web-Ausgaben dieser Zeitung. So finden Sie etwa am 6. April unter der Rubrik ''City'' den Artikel ''Bank fail to halt dollar's retreat'' mit Verweisen auf frühere Artikel zu verwandten Themengebieten.

Wesentlich umfangreicher als die ELSTER-Zusammenstellung ist Steve Outing's ''Newspaper Services Accessible on the Internet'', zu finden unter

http://marketplace.com/e-papers.list.www/e-papers.home.page.html

Ein Überblick sämtlicher Links ohne Kommentar bietet

http://marketplace.com/e-papers.list.www/e-papers.links.html

Während das Wall Street Journal

http://dowvision.wais.net/

eine Registrierung verlangt, bevor Sie in deren Datenarchiven stöbern können, bieten beispielsweise der San Francisco Chronicle

http://www.sfgate.com/new/chron/index.cgi

und der San Francisco Examiner

http://www.sfgate.com/examiner/

einen freien Zugang an. In den letzteren beiden Zeitungen können Sie über

http://www.sfgate.com/search

auch nach Stichwörtern suchen. Beim Suchbegriff ''currency'' stoßen Sie beispielsweise auf den Artikel ''What falling dollar will hit'' von Louis Trager vom 7. März im San Francisco Examiner.

Ein Blick auf den deutschen Zeitschriftenmarkt zeigt ein zu erwartendes Übergewicht im Bereich DV/Informatik. Bemerkenswert erscheinen mir die Aktivitäten des SPIEGEL (http://www.spiegel.de/), der das Web schon seit geraumer Zeit als Informations- und natürlich auch als Werbemedium entdeckt hat. In ähnlicher Form stellt Spektrum der Wissenschaft (http://www.venture.net/) seit kurzer Zeit Beiträge zur Verfügung. Gähnende Leere zeigt sich dagegen bei den etablierten Tageszeitungen, (nicht nur) hier besteht noch vehementer Nachholbedarf.

Literatur

[1] Behme, Henning: Jäger und Sammler
in: iX Multiuser Multitasking Magazin, 12/1994, pp. 78
(http://www.ix.de/ix/raven/Web/9412/WebPoints.html)

[2] Behme, Henning: Lies mich, bevor du gehst
in: iX Multiuser Multitasking Magazin, 3/1995, pp. 105
(http://www.ix.de/ix/raven/Web/9503/WebZs.html)


Ansprechpartner im URZ:

Ingo Kemmerzell                Zimmer  In: AS-301     CEO-Mail: kemmerzell 
                               Tel.: -1888            PMail: ingo.kemmerzell
Dr. Bernward Tewes             Zimmer  Ei: eO-106     CEO-Mail: tewes
                               Tel.: -1667            PMail: bernward.tewes