Collaborative Filtering in Medienportalen – wie der Zufall so spielt

In jüngster Zeit stoße ich auf Nachrichtenportalen und anderen Online-Seiten vermehrt auf „Mehr zum Thema“ oder „Das könnte Sie interessieren“ – Links. Eigentlich ja eine schöne Sache. Leider lässt die Qualität dieser Empfehlungen jedoch oft sehr zu wünschen übrig.

Ein gutes Negativbeispiel durfte ich erst gestern abend wieder erleben. Aus aktuellem Anlass musste ich mich mit einem Krankheitsthema beschäftigen und fand eine sehr gute Seite. Nach Lesen des Artikels waren aber nicht alle meine Fragen geklärt – Hinweise auf weitere Links sind da willkommen. Doch dann fand ich das:

Ein sehr anschauliches Beispiel warum "collaborative filtering" bei Medieninhalten nicht funktioniert

Die Betreiber oder die Redaktion des Portals waren offensichtlich der Meinung, dass jemand der sich für die Entfernung einer Gallenblase interessiert, auch an der Vergrößerung primärer Geschlechtsmerkmale interessiert ist, oder als Hypochonder auch über alle Arten von Tumoren gerne liest. Der dritte Link zielt auf die gleiche URL, die ich gerade gelesen habe. Ist das als ein freundlicher Hinweis des Empfehlungsdienstes plista zu verstehen, dass ich das noch einmal lesen sollte? Und warum Personen, die sich für gewisse Krankheitsbilder interessieren auch einen Opel fahren sollten, kann mir vermutlich auch niemand erklären.

Die Ursache für diese verwirrenden Empfehlungen ist leicht zu erklären. Der online-Dienst plista arbeitet auf der Basis sog. collaborative Filtering. Dieses den meisten von uns über amazon bekannte Verfahren funktioniert so, dass gemessen wird, worauf User im Internet nacheinander clicken. Aus dem click-Verhalten vieler User wird abgeleitet, welche clicks in einem (wie auch immer gearteten) Zusammenhang stehen. Für den Erwerb von Produkten ist das in vielen Fällen sehr sinnvoll (wenn ich bspw. darüber darauf aufmerksam werde, dass dem Drucker kein USB-Kabel beiliegt). Aber für Inhalte aller Art ist das Verfahren wie das obige Beispiel vollkommen ungeeignet. Die inhaltlichen Interessen von Menschen sind derart divers und heterogen, dass es dem Zufall gleich kommt, was mir das collaborative Filtering-Verfahren als Empfehlung anbietet – wie das obige Beispiel zeigt. Deutlich überlegen sind für Empfehlungen von Inhalten semantische Empfehlungsdienste, die dann eben wirklich einen inhaltlich sinnvollen Zusammenhang aufzeigen.

Hinterlasse einen Kommentar