Keyword Clouds durch automatische Indexierung
Zur Verbesserung der erzeugten Keyword Cloud schlägt Nial Kennedy vor, das Ergebnis der Y! API mit dem der Technorati-API zu verbinden.
Prolematisch für nicht-englische Inhalte sind die fehlenden Stoppwortlisten. Zwar kann man bei ZoomClouds bis zu 200 ‘Tags’ ausschließen, aber schon allein die Stoppwortliste von phpBB hat mehr als 1500 Einträge für die deutsche Sprache. Für die obige Wolke habe ich zehn Stoppworter definiert, vor allem Artikel und Konjugationen. Im Laufe der Zeit werden mit Sicherheit weitere Stoppworter hinzukommen.
Ein weiterer Dienst dieser Art ist Tagyu. Dort wird eine nicht näherer erläuterte Eigenentwicklung zur automatischen Indexierung benutzt. Für den letzten WWWorker-Eintrag, AOL veröffentlicht ‘anonymisierte’ Suchanfragen seiner Nutzer, gibt Tagyu die Keywords proxy weird news content datenbank geokoordinaten opensource sowie als Kategorie Sports zurück. Mit nicht-englischen Texten kommt also auch Tagyu nicht zurecht. Interessant ist die Idee, auf Basis der Keywords hierarchische Kategorien zu bilden.
Kennt Ihr weitere web-basierte Dienste, die Keywords aus Texten extrahieren? Vielleicht sogar einen Dienst, der mit der deutschen Sprache zurecht kommt?