Ein Universum im Alpha-Stadium

Veröffentlicht am Sonntag, 4. November 2007, von infinity auf Alphane Moon

Das Wort „Visvo“ kommt aus der Sanskritsprache und bedeutet „Universum“. Visvo ist auch der Name einer neuen Suchmaschine, die zur Zeit im Alpha-Stadium läuft. Es ist doch immer schön, wenn es etwas Neues gibt.

Die Suchmaschine Visvo wurde im Juni 2007 von der Firma Visvo Inc. aus Dallas gestartet. Auf der Visvo-Website findet man einige Angaben über die (winzige) Größe des Index: 50 Millionen Seiten sollen es schon sein. Als Ziel werden 100 Millionen indexierte Seiten im August 2007 genannt. Dann dürften es inzwischen deutlich mehr sein, denn es ist schon November und an „Universen“ stellt man allgemein hinsichtlich der Größe gewisse Erwartungen.

Screenshot der Startseite von Visvo

Technologie: „Category Search Engine“

Visvo versteht sich als „Category Search Engine“. Neu indexierte Webseiten werden automatisch in relevante Kategorien sortiert. Die Menge der Kategorien wird ständig erweitert während der Index wächst. Eine Analyse der Linkstruktur soll eine untergeordnete Rolle bei der Bestimmung der „Relevanz“ spielen:

Visvo uses some link analysis to help determine relevancy of page content, but it is a minor factor. Category relevance is the major determining factor for pages in Visvo’s index.

Bei der Bestimmung der „Kategorie-Relevanz“ wird der Seiteninhalt analysiert. Der Visvo-Algorithmus zerlegt ein Dokument in eine Reihe von Phrasen oder „tokens“. Die „tokens“ einer Seite werden mit ähnlichen „tokens“ der Kategorien verglichen und die Seite wird schließlich derjenigen Kategorie zugeteilt, die am besten passt.

Visvo uses some natural language technology to help determine relevant categories for webpages.

Zusätzlich zu NLP kommt noch maschinelles Lernen zum Einsatz.

VisBot, der Crawler von Visvo

Über Visvos Crawler VisBot kann ich bisher nichts Negatives berichten. VisBot hat als erstes nach der robots.txt gefragt und dann die Startseite der Website gecrawlt.

VisBot kam von der IP-Adresse 72.249.60.74 und verwendete diesen User-Agent-String:

VisBot/2.0 (Visvo.com Crawler; http://www.visvo.com/bot.html; bot@visvo.com)

Update: neuer User-Agent-String

VisBot kommt jetzt von der IP-Adresse 72.249.62.97 und hat einen neuen User-Agent-String:

Visbot/2.0 (+http://www.visvo.com/en/webmasters.jsp;bot@visvo.com)

Ressourcen

all content copyright © 2007-2010 Alphane Moon