Der
Recherchekompass
|
[ home | anleitungen | recherchen | hilfe | sitemap | index | suchen ] |
---|
home » anleitungen » findefibel | Die Suchseite » |
|
| ||||||||||
Mit dem Internet steht dem Benutzer ein riesiger Pool an Informationen
zur Verfügung. Damit ergibt sich aber gleichzeitig auch ein Problem, nämlich:
Wo sind die Informationen zu finden, die gesucht werden und wie können
die Informationen umgangen werden, die nicht von Interesse sind?
Glück hat derjenige, der von anderen auf die Quellen hingewiesen wird,
die für ihn von Interesse sind. Die anderen müssen selber suchen. Um diesen zu
helfen sind im Internet eine Reihe von Suchdiensten eingerichtet. Dies sind
vor allem die Suchmaschinen für das World Wide Web, von denen viele auch
im Usenet oder nach FTP-Dateien und e-Mail-Adressen suchen.
Aber allein durch die schiere Menge von Informationsquellen, helfen einem
diese Dienste nicht mehr oher weiteres weiter, wenn man nicht die richtige
Strategie für die Suche hat.
Die Menge der Informationen im Internet wächst ständig. Zur Zeit (Anfang 2000) sollen mehr als 800 Mio. Websites mit über 6 Millionen Terabyte auf drei Millionen Servern vorhanden sein. Doch selbst die derzeit leistungsfähigste Suchmaschine Northern Light hat nicht mehr als 16% der Webinhalte indiziert, wie eine Studie des NEC Research Institute ermittelte. Sogar alle Suchmaschinen zusammen sollen gerade einmal 42% der Seiten erfassen.
Bei der Suche nach Informationen liegt das Problem jedoch ganz woanders: Bei einer Anfrage zu einem verbreiteten Themenbereich bekommt man bei den Suchmaschinen in aller Regel eine imense Zahl von Seiten angeboten, die dem Suchenden kaum weiterhilft. Nicht selten kommen einige Tausend Seiten zusammen. Der überwiegende Teil davon ist unbrauchbar. Von den Ergebnislisten werden allenfalls die ersten Seiten angesehen, und dabei nicht zwangsläufig die gewünschten Inhalte gefunden. Entscheidend für den Erfolg der Recherche ist daher nicht vorrangig die Leistungsfähigkeit einer Suchmaschine, sondern die Vorgehensweise des Suchenden.
|
Bei der einfachen Suche nach dem Begriff "spedition" ergab
sich die nebenstehende Anzahl von Treffern bei den Suchmaschinen.
Es wurde nur im deutschen Sprachraum gesucht. Die Ergebnisse wurden
nicht weiter untersucht. (10. Mai 2000) |
Nicht jede Suchmaschine ist für jede Recherche gleichermaßen geeignet. Insbesondere die Suche nach konkreten Branchen- oder Wirtschaftsinformationen ist effektiver, wenn statt der allgemein gebräuchlichen Webkataloge und Suchmaschinen in speziellen Datenbanken oder Verzeichnissen recherchiert wird.
Am Anfang einer Recherche sollten einige Überlegungen zum Vorgehen bei der Suche stehen, denn letztendlich ist jede Suchmaschine nur so gut, wie der Nutzer, der sie bedient. Ohne Vorwissen über das was man sucht, ist man oftmals auf verlorenem Posten, wo nur noch Phantasie helfen kann. Zunächst ist zu überlegen, wie das Gesuchte am besten zu be- oder umschreiben ist, vielleicht hilft es auch sagen zu können was es nicht ist. Man muss sich schon Gedanken machen, welcher Suchbegriff bzw. welche Kombination von Suchbegriffen zu relevanten Ergebnissen führen dürfte.
Um jedoch einen umfassenderen Überblick über ein Wissensgebiet zu erhalten, ist die professionelle Recherche mit Hilfe verschiedener Suchdienste zu empfehlen. Dabei hat man folgende Optionen: Nutzt man eine "normale" Suchmaschine oder besser einen Webkatalog? Erweitert man die Suchbasis und verwendet eine Metasuchmaschine oder nutzt man eine spezialisierte Suchmaschine und schränkt die Suchbasis dadurch ein?
Die Suche im Internet wird vor allem durch die Suchbasis und den Lösungsraum bestimmt. Unter der Suchbasis ist die Menge an Adressen und Dokumenten zu verstehen, die bei einem Suchdienst in die Datenbank aufgenommen worden sind (indiziert). Als Lösungsraum wird die Menge an Dokumenten bezeichnet, die aufgrund einer Anfrage ermittelt und in der Ergebnisliste aufgeführt werden.
|
Damit die ermittelten Resultate überhaupt verwertbar sind, kommt der Eingrenzung des Lösungsraums große Bedeutung zu.
Suchdienste benutzen unterschiedliche Sortierungen der Ergebnisliste, die meisten benutzen heute eine "Signifikanzwahrscheinlichkeit", bei der aus der Häufigkeit des Auftretens des gesuchten Begriffes und/oder anderen Kriterien eine absteigende Reihenfolge gebildet wird. Dadurch sind die ersten Einträge der Ergebnisliste wahrscheinlich gute Treffer. Aber Achtung: Manche Suchdienste positionieren den Link an oberster Stelle, dessen "Besitzer" am meisten dafür zahlt!
Ist die Entscheidung für eine bestimmte Suchhilfe gefallen, sollte der Einsatz geeigneter Techniken zur Eingrenzung der Suchergebnisse vorbereitet werden. Neben der Auswahl der geeigneten Suchhilfen sind natürlich gut gewählte Suchwörter das A und O bei der Internetrecherche. Darüberhinaus bieten die Suchmaschinen vielfältige Möglichkeiten an, um die Suchanfrage möglichst präzise zu formulieren und damit die Größe der Ergebnisliste zu bestimmen. Leider sind die Möglichkeiten der Abfrageoptionen abhängig von der verwendeten Suchmaschine und die sind nicht immer gleich.
Die ganz besondere Strategie bei der Benutzung von Suchmaschinen lautet: Erst einmal in die Hilfe hineinschauen, und dort die Optionen für die erweiterte Suche heraussuchen. Jede Suchmaschine bietet ein eigenes Hilfesystem an, dessen Einstieg in der Regel auf der ersten Seite zu finden ist. Aber nicht alle Hilfen sind auch wirklich hilfreich. Daher kann die Wahl einer Suchmaschine auch schon mal davon abhängen, wie gut die Erklärungen für die Eingrenzung der Suche sind.
Die folgende Aufstellung enthält die gebräuchlichsten Operatoren und Suchangaben. Sie soll dabei helfen einen ersten Einstieg in die Suchmaschinen zu erreichen und eine überschaubare Anzahl qualitativ hochwertiger Suchergebnisse zu erhalten.
| ||||||||||||||||||||
Tabelle: Operatoren bei der Gestaltung von Suchanfragen. |
Die Verwendung sogenannter "Stopp-Wörter" sollte bei der Recherche vermieden werden. Als Stopp-Wörter werden Einzelbuchstaben, Satzzeichen oder HTML-Befehle sowie in einer Sprache häufig vorkommende Worte bezeichnet, z.B. Artikel (der, die, das). Diese Begriffe helfen bei der Einschränkung der Suche nur wenig, in vielen Fällen würden sie nur den Lösungsraum unnötig erweitern, gleichzeitig verlangsamen sie aber die Geschwindigkeit der Suche bedeutend. Daher ignoriert - beispielsweise - Google solche allgemeinen Wörter und Buchstaben automatisch.
Wenn die Verwendung von Stopp-Wörtern geboten ist, z.B. bei der Suche nach Film- oder Buchtiteln, bietet es sich an nach Textpassagen zu suchen (s.o.) oder - sofern die Suchmaschine dies unterstützt - kann durch die explizite Verwendung der UND-Verknüpfung ein Umgehen des Ausschlusses erzwungen werden. Bei Google - beispielsweise - kann man das "+"-Zeichen, um Stopp-Wörter in der Suche zu benutzen, dabei dürfen aber keine Leerstellen zwischen dem "+"-Zeichen und dem Suchwort sein.
Wer keine genaue Vorstellung davon hat, welche Begriffe das Gesuchte am besten beschreiben, für den leisten thematisch sortierte Kataloge gute Dienste. Man nähert sich hierbei dem Gesuchten durch ständige Auswahl von angebotenen Unterthemen. Die hierdurch gefundenen Adressen eignen sich meist sehr gut als Startplattform für weitere Recherchen. Dies schon allein dadurch, dass in den Seiten Begriffe auftreten die ein intensiveres Suchen ermöglichen.
Webkataloge sind immer dann empfehlenswert, wenn nach allgemeinen Themen gesucht wird, bei denen es bei Suchmaschinen zu einer riesigen Zahl von Treffern kommen dürfte. (Beispiel: Die Suche nach "spedition" führt bei Web.de im "Verzeichnis" zu 2 Kategorien und 344 Treffern, aber bei der Suche in den "dt. Websites" zu 19992 Treffern.) Wenn man noch kein klares Bild vom Gesuchten hat, ist der Katalog auch von Vorteil, da die Kategorien nicht an einzelne Begriffe gebunden sind, sondern mehr an ein Begriffssystem, welches der Redakteur von dem Gebiet hat. Suchmaschinen können dagegen ihre Stärken ausspielen, wenn nach mehreren Begriffen bzw. Kombinationen von Begriffen gesucht wird.
Sogenannte Metasuchmaschinen führen die Suche nicht auf einer eigenen Datenbank durch, sondern leiten die Anfrage gleichzeitig an die mehrere Suchmaschinen weiter. Die Suche findet von daher in der vereinigten Suchbasis aller benutzten Suchmaschinen statt und stellt damit eine erhebliche Erweiterung dar. Genau wie normale Suchmaschinen können auch Metasuchmaschinen auf bestimmte Bereiche des Internets eingegrenzt oder auch spezialisiert sein.
Die Möglichkeiten zur Formulierung der Suchanfragen sind bei Metasuchmaschinen im Vergleich zu den befragten Suchmaschinen eher eingeschränkt, da grundsätzlich vergleichbare Anfragen formuliert werden müssen, um die Ergebnisse zusammenführen zu können. So ist die logische Und-Verknüpfung zweier Begriffe in der Anfrage - je nach Sprache - durch "and" oder "und", wieder andere (z.B. Yahoo) benötigen ein plus-Zeichen vor jedem Suchbegriff. Die Metasuchmaschine muss nun all diese Möglichkeiten kennen und kann bei der Formulierung der Anfrage nur die gemeinsame Untermenge zulassen.
Die Ergebnisse der Anfragen werden in der Regel zusammengeführt, wobei Dubletten aussortiert werden (sollten). Die Signifikanz der Seiten wird über die Anzahl der Suchmaschinen in denen eine Seite gefunden wurde gebildet, zuzüglich der Signifikanz die von den befragten Suchmaschinen kommt. Da komplexe Suchanfragen über viele Suchmaschinen eventuell sehr lange dauern können, bieten einige Metasuchmaschinen die Möglichkeit die Ergebnisliste per Email zuzustellen. (Der Unterschied zu Suchseiten ist erkennbar, diese fragen zwar gleichzeitig mehrere Suchmaschinen ab, die Ergebnisse werden aber entweder in entsprechend vielen Browserfenstern dargestellt oder in einer Liste einfach aneinander gehängt.)
Der Einsatz von Metasuchmaschinen ist insbesondere dann sinnvoll, wenn wenig gebräuchliche und sehr spezielle Begriffe gesucht werden und ein möglichst großer Teil des Internet durchsucht werden soll. (Beispiel: Die Suche nach "VanCarrier" liefert bei Metager (www.metager.de) 30 Treffer (Suchzeit: 30 sek.); die Abfrage bei Altavista (de.altavista.com) liefert lediglich 2 Seiten.)
Spezialverzeichnisse oder spezialisierte Suchmaschinen sind prinzipiell gleich aufgebaut wei normale Suchmaschinen, decken aber von vornherein nur ein bestimmtes Themengebiet ab, d.h. es werden nur Seiten eines speziellen Themas aufgenommen und indiziert. Hinsichtlich des Themengebietes sind sie aber zumeist besser geordnet und umfassen mehr Seiten zu einem speziellen Gebiet als "allgemeine" Suchmaschinen bzw. Kataloge.
Spezialverzeichnisse gibt es zu den unterschiedlichsten Themen, mitunter sind diese Themen so speziell, dass auch die Suchmaschinen nur einem sehr begrenzten Publikum bekannt sind.
Der Begriff bot ist eine Kurzform von Robot, welches sich wiederum vom russischen Wort robota ableitet. (Ja, Ja, der gute alte Stanislaw Lem.) Bots werden auch als Spider oder Agenten bezeichnet und, zur Zeit noch in erster Linie, zur Informationsrecherche im Internet eingesetzt. Viele Suchdienste bedienen sich dieser Agenten, um neue Inhalte im Web aufzuspüren (z.B. Webcrawler: www.webcrawler.com) oder gemeldete Seiten zu durchsuchen (z.B. eXcite: www.excite.de).
Aber auch dem Normalbürger des Internet stehen die dienstbaren Geister immer häufiger zur Verfügung. So bieten immer mehr Server diesen Dienst für ihre Spezialgebiete an und durchsuchen von ihrer Basis aus das ganze Netz oder nur Teile davon, ganz so wie es gewünscht ist. Es gibt bots die nach demoskopischen Daten oder Schnäppchen suchen:
Bots sind aber nicht überall gern gesehene Gäste und werden daher von manchem Server ausgesperrt. Durch die Vielzahl dieser elektronischen Schnüffler werden die Server belastet und es läßt sich nicht mehr kontrollieren, welche Informationen gelesen werden. Daher melden auch manche Datenschützer bedenken gegen den Einsatz von bots an.
Die bisher genannten bots sind sogenannte "serverbased" Bots, welche auf Servern im Internet realisiert sind. Daneben gibt es aber auch "clientbased" Bots oder Agenten, mit denen bereits Offline die Abfragen formuliert und die Ergebnise gesichtet werden können. Die bekanntesten Vertreter dürften wohl die Archie-Clients für die Suche auf FTP-Sites sein. Wie dieser auch, so bedienen sich auch die neueren dieser Bots den bekannten Suchmaschinen im Web und fragen diese ab. Ein sehr interessanter Vertreter ist zu finden:
Wer Rückfragen oder Anregungen hat, der schreibe mir doch einfach: mailto:hgm |
Verweise | ||
---|---|---|
(Ich bin nicht verantwortlich für Inhalte externer Internetseiten.) |
[Seitenanfang] | geändert: 01.12.2010 by hgm |
© 1999-2002, Hans-G. Mekelburg, all rights reserved. [ impressum | datenschutz | haftungsausschluss ] |