Teil 2: Yahoo Boss Web Suche
- Yahoo Boss Web Suche
- Teil 2: Yahoo Boss Web Suche
- Teil 3: Yahoo Boss Web Suche
- Teil 4: Yahoo Boss Web Suche
Wenn Sie beispielsweise nicht an den Berichten über das Duell in der Nationalmannschaft mit Jens Lehmann interessiert sind, so lautet die Suchanfrage folglich...
Wenn Sie beispielsweise nicht an den Berichten über das Duell in der Nationalmannschaft mit Jens Lehmann interessiert sind, so lautet die Suchanfrage folglich
boss.yahooapis.com/ysearch/web/v1/
"Oliver Kahn" -"Jens Lehmann"?appid=xyz&format=xml
Mithilfe der Operators site schränken Sie die Treffermengen auf bestimmte Seiten ein oder grenzen diese explizit aus.
Wenn Sie also alle Informationen von Oliver Kahn suchen, die Yahoo bei Wikipedia gefunden hat, so lautet die Suche
boss.yahooapis.com/ysearch/web/v1/
"Oliver Kahn"+site: wikipedia.org?appid=xyz&format=xml
In den verschiedenen Landesausgaben findet die Suchmaschine von Yahoo immerhin noch Mitte September 3.131 Treffer. Trotz des Karriereendes wird dem ehemaligen Nationaltorhüter offenbar noch einiges Interesse, auch im Ausland, zuteil. Stellen Sie dem Parameter site im Übrigen ein Minus voran, so werden die Treffer dieser Webseite aus der Ergebnisliste explizit ausgeschlossen.
Suche im Web
Der Platzhalter {anwendung} aus dem generischen Suchstring wird für Websuchen durch den Parameter web ersetzt. Zusätzlich stehen Ihnen für die Suche innerhalb von HTML-Seiten zwei weitere Attribute zur Verfügung, welche die Trefferlisten genauer beschreiben sollen:
• filter eliminiert bestimmte Inhalte, wobei diese in der jetzigen Version der API sich auf die beiden Bereiche pornografische Inhalte und Hassparolen beschränken. Die entsprechenden Filterwerte sind porn und hate. • type legt das Format des Trefferdokuments fest.
Das Filterargument zum Aussperren pornografischer Inhalte und Hassparolen innerhalb Ihrer Trefferliste ist auf bestimmte Sprachen begrenzt - hate zeigt nur bei der englischen Sprache Wirkung, während die Filterung von pornografischen Inhalten für die wichtigsten Sprachen vorliegt, darunter auch Deutsch, Englisch, Spanisch und Französisch.
Wenn Sie also etwa nach Artikeln über Britney Spears suchen, dabei jedoch die extremen Eskapaden nach ihrer Scheidung nicht berücksichtigt werden sollen, schränken Sie dies am besten wie folgt ein:
boss.yahooapis.com/ysearch/web/v1/
"Britney Spears"?appid=xyz&format=xml&filter=-porn
Diese Anfrage liefert eine Treffermenge von 6.397.594 Ergebnissen, wobei die offizielle Homepage der Sängerin auf Platz 1 steht. Drehen Sie nun den Spieß herum und lassen sich nun alle anzüglichen Seiten anzeigen - zu erreichen durch das Entfernen des Minus vor porn - bekommen Sie immerhin noch 1.243.722 Treffer.
Nicht minder wichtig ist der Parameter type, welcher eine bessere Vorfilterung der Ergebnismenge nach Art des Treffers erlaubt. Dazu bietet Ihnen Yahoo Boss folgende Werte an:
• html - Seiten im HTML-Format • text - Testdokumente • pdf - Adobe-PDF-Dokumente • xl - Excel Dateien: xls, xla, xl • msword - Microsoft-Word-Dateien • ppt - Microsoft-Power-Point-Folien • msoffice - Excel, Word, Powerpoint • nonhtml - alle Werte außer html
Sind Sie also auf der Suche nach PDF-Dokumenten, welche im Zusammenhang mit vertraulichen Informationen stehen könnten, so könnte die Anfrage folgendermaßen lauten:
boss.yahooapis.com/ysearch/web/v1/
confidential?appid=xyz&format= xml&type=pdf
Das Ergebnis beinhaltet jedoch nicht, wie erwartet oder zumindest erhofft, vertrauliche Informationen, sondern zeigt Ihnen auf den ersten Plätzen diverse Verschwiegenheits- erklärungen unterschiedlicher Firmen.
Ergebnisliste Web
Jede Trefferliste hat einige individuelle Eigenheiten, jedoch auch einen grundsätzlich ähnlichen Aufbau und zum größten Teil auch gleiche Bezeichner:

• count - Anzahl der Ergebnisse, die pro Seite angezeigt werden. • start - Ziffer, bei der der Zähler beginnt. • totalhits - Anzahl der Treffer unter den Aspekten: keine doppelten Einträge für gleiche Dokumente, nur zwei Treffer pro Host. • deephits - der Wert dieser Variablen bezieht auch alle doppelten Einträge und mehr als zwei Treffer pro Host mit ein. Dadurch ist der Wert in den meisten Fällen deutlich größer als totalhits. • abstract - Kurzbeschreibung des Treffers, wobei der oder die Suchbegriffe optisch hervorgehoben werden per <b>-Tag. • title - Titel der Webseite mit hervorgehobenen Suchbegriffen. • url - URL des Ergebnisses. • clickurl - URL in Verknüpfung mit der Suchanfrage und der Ziel-URL. • dispurl - URL des Zieldokuments für Anzeigezwecke. • size - Größe des Dokuments in Bytes. • date - Speicherdatum des Dokuments im Format JJJJ/MM/TT.