Aus dem Forschungsprojekt mit den Hochschulen kommen die ersten Ergebnisse:
An der Universität Zürich wird mit einem Algorithmus nach Vincent Blondel experimentiert. Die Bildung von Kategorien beruht auf den Ergebnissen einer Distanzmatrix. An der ZHAW wird das Clustering mittels Hauptkomponentenanalyse und Graphen-theoretischen Anwendungen erforscht.
Die erzielten Ergebnisse sind noch nicht optimal. Einer der Gründe ist der Mangel an Anzahl Texten. Normalerweise wird beim Clustering eine sehr grosse Anzahl Texte verwendet (zum Beispiel bei Google). Diese Problematik könnte abgeschwächt werden durch die Berücksichtigung von Inhalten ähnlicher Projekte, um mehr Texte miteinander abgleichen zu können.
Weiter könnte die ungenügende Kategorisierung durch Benutzerinteraktion verbessert werden. Die vom Algorithmus vorgeschlagene Kategorisierungen würden dabei entweder durch die Innovatoren oder durch die Moderatoren angepasst und erweitert.
Wir sind gespannt auf die nächsten Ergebnisse!

