Zum Inhalt springen
Der Guide für ein smartes Leben.
Eigene Suche mit Hilfe von Yahoo

Teil 2: Yahoo Boss Web Suche

Autoren: Redaktion pcmagazin und Andreas Hitzig • 26.2.2009 • ca. 2:55 Min

Wenn Sie beispielsweise nicht an den Berichten über das Duell in der Nationalmannschaft mit Jens Lehmann interessiert sind, so lautet die Suchanfrage folglich...

Wenn Sie beispielsweise nicht an den Berichten über das Duell in der Nationalmannschaft mit Jens Lehmann interessiert sind, so lautet die Suchanfrage folglich

boss.yahooapis.com/ysearch/web/v1/
"Oliver Kahn" -"Jens Lehmann"?appid=xyz&format=xml

Mithilfe der Operators site schränken Sie die Treffermengen auf bestimmte Seiten ein oder grenzen diese explizit aus.

Wenn Sie also alle Informationen von Oliver Kahn suchen, die Yahoo bei Wikipedia gefunden hat, so lautet die Suche

boss.yahooapis.com/ysearch/web/v1/
"Oliver Kahn"+site: wikipedia.org?appid=xyz&format=xml

In den verschiedenen Landesausgaben findet die Suchmaschine von Yahoo immerhin noch Mitte September 3.131 Treffer. Trotz des Karriereendes wird dem ehemaligen Nationaltorhüter offenbar noch einiges Interesse, auch im Ausland, zuteil. Stellen Sie dem Parameter site im Übrigen ein Minus voran, so werden die Treffer dieser Webseite aus der Ergebnisliste explizit ausgeschlossen.

Suche im Web

Der Platzhalter {anwendung} aus dem generischen Suchstring wird für Websuchen durch den Parameter web ersetzt. Zusätzlich stehen Ihnen für die Suche innerhalb von HTML-Seiten zwei weitere Attribute zur Verfügung, welche die Trefferlisten genauer beschreiben sollen:

filter eliminiert bestimmte Inhalte, wobei diese in der jetzigen Version der API sich auf die beiden Bereiche pornografische Inhalte und Hassparolen beschränken. Die entsprechenden Filterwerte sind porn und hate. • type legt das Format des Trefferdokuments fest.

Das Filterargument zum Aussperren pornografischer Inhalte und Hassparolen innerhalb Ihrer Trefferliste ist auf bestimmte Sprachen begrenzt - hate zeigt nur bei der englischen Sprache Wirkung, während die Filterung von pornografischen Inhalten für die wichtigsten Sprachen vorliegt, darunter auch Deutsch, Englisch, Spanisch und Französisch.

Wenn Sie also etwa nach Artikeln über Britney Spears suchen, dabei jedoch die extremen Eskapaden nach ihrer Scheidung nicht berücksichtigt werden sollen, schränken Sie dies am besten wie folgt ein:

boss.yahooapis.com/ysearch/web/v1/
"Britney Spears"?appid=xyz&format=xml&filter=-porn

Diese Anfrage liefert eine Treffermenge von 6.397.594 Ergebnissen, wobei die offizielle Homepage der Sängerin auf Platz 1 steht. Drehen Sie nun den Spieß herum und lassen sich nun alle anzüglichen Seiten anzeigen - zu erreichen durch das Entfernen des Minus vor porn - bekommen Sie immerhin noch 1.243.722 Treffer.

Nicht minder wichtig ist der Parameter type, welcher eine bessere Vorfilterung der Ergebnismenge nach Art des Treffers erlaubt. Dazu bietet Ihnen Yahoo Boss folgende Werte an:

• html - Seiten im HTML-Format • text - Testdokumente • pdf - Adobe-PDF-Dokumente • xl - Excel Dateien: xls, xla, xl • msword - Microsoft-Word-Dateien • ppt - Microsoft-Power-Point-Folien • msoffice - Excel, Word, Powerpoint • nonhtml - alle Werte außer html

Sind Sie also auf der Suche nach PDF-Dokumenten, welche im Zusammenhang mit vertraulichen Informationen stehen könnten, so könnte die Anfrage folgendermaßen lauten:

boss.yahooapis.com/ysearch/web/v1/
confidential?appid=xyz&format= xml&type=pdf

Das Ergebnis beinhaltet jedoch nicht, wie erwartet oder zumindest erhofft, vertrauliche Informationen, sondern zeigt Ihnen auf den ersten Plätzen diverse Verschwiegenheits- erklärungen unterschiedlicher Firmen.

Ergebnisliste Web

Jede Trefferliste hat einige individuelle Eigenheiten, jedoch auch einen grundsätzlich ähnlichen Aufbau und zum größten Teil auch gleiche Bezeichner:

Yahoo Boss: Build Your Own Search Service
Die Yahoo Boss API bietet die Trefferliste entweder in XML oder JSON an.
© Archiv

count - Anzahl der Ergebnisse, die pro Seite angezeigt werden. • start - Ziffer, bei der der Zähler beginnt. • totalhits - Anzahl der Treffer unter den Aspekten: keine doppelten Einträge für gleiche Dokumente, nur zwei Treffer pro Host. • deephits - der Wert dieser Variablen bezieht auch alle doppelten Einträge und mehr als zwei Treffer pro Host mit ein. Dadurch ist der Wert in den meisten Fällen deutlich größer als totalhits. • abstract - Kurzbeschreibung des Treffers, wobei der oder die Suchbegriffe optisch hervorgehoben werden per <b>-Tag. • title - Titel der Webseite mit hervorgehobenen Suchbegriffen. • url - URL des Ergebnisses. • clickurl - URL in Verknüpfung mit der Suchanfrage und der Ziel-URL. • dispurl - URL des Zieldokuments für Anzeigezwecke. • size - Größe des Dokuments in Bytes. • date - Speicherdatum des Dokuments im Format JJJJ/MM/TT.