March 3rd, 2011 by Thomas No comments »

Interessengebiete erkennen und darstellen

February 22nd, 2011 by Thomas No comments »

Interesse – aus dem Lateinischen: inter „zwischen, inmitten“ und esse „sein“ oder interesse „teilnehmen an“. Als Interesse bezeichnet man das kognitive Anteilnehmen bzw. die Aufmerksamkeit, die jemand einer Sache oder einer Person widmet.

Die Interessengebiete des Einzelnen lassen sich bei Weitem nicht so einfach beschreiben. Schließlich geht es nicht um einzelne Sachen, sondern um ganze Themenkomplexe, die kaum klar abzugrenzen sind und sich ständig wandeln. Trotzdem ist es möglich, die Interessen einer Person maschinell zu erkennen. Um für den User nutzbar zu sein, müssen diese erkannten Interessen so dargestellt werden, dass für ihn klar ersichtlich ist, worum genau es geht.

Grundlagen

Um anderen unsere Interessen, Hobbys und Vorlieben zu beschreiben, benutzen wir Sprache. Sprache ist in diesem Fall nichts anderes als die artikulierte Verwebung von unterschiedlich wichtigen Begriffen und deren Zusammenhängen, die das Was und Wie unserer Interessen beschreiben. Für eine simple Darstellungsweise, wie sie im Web benötigt wird, wäre eine 1:1-Abbildung dieser semantischen Netze viel zu komplex.

Umschreibung

Die Begrenzung eines Themengebietes wird durch die enthaltenen Begriffe und deren Zusammenhänge definiert. Sehr vereinfacht dargestellt, könnte das so aussehen:

Diese Übersicht ist sehr schematisch und äußerst stark vereinfacht dargestellt, da jeder Begriff mit mehreren anderen auf unterschiedlichste Weise verbunden ist – eine solche Darstellung wäre ein heilloses Durcheinander. Trotzdem gibt diese Übersicht eine guten Einblick, für welches Themengebiet der Nutzer sich interessiert. Es ist, als betrachte man ein Bild aus großer Entfernung – man kann die Farben und groben Formen erkennen, mehr jedoch nicht.

Konkretik

Was fehlt, ist die Konkretik. Um herauszufinden wofür der Nutzer sich genau interessiert, wird zusätzlich berücksichtigt, mit welcher Häufigkeit die Begriffe auftauchen und mit welcher Häufigkeit sie mit anderen verbunden sind. Durch diese Bewertung ergibt sich ein klareres Bild der Interessenschwerpunkte. Diese Gewichtung zeichnet sozusagen die Konturen des Bildes.

Das Resultat

Verbindet man nun beide Informationen – Zusammenhänge und Häufigkeiten – ist es möglich, sehr genau zu definieren, wofür der Nutzer sich interessiert.

Damit die User diese erkannten Interessen auch sinnvoll nutzen können, müssen sie ihnen einfach und verständlich angezeigt werden. Die Informationen aus den semantischen Netzen und der Häufigkeitsverteilung werden dabei soweit reduziert, dass für die Nutzer die Bedeutung noch klar erkennbar ist. Ebenso wird auf bekannte Darstellungsformen zurückgegriffen. So kommen bei Suggy diese beiden Darstellungen vor:

angelehnt an Tag-Clouds

als klassische Liste

Im nächsten Artikel

Es gibt viele Wege, die Bedeutung von Begriffen und Texten zu analysieren. Einen davon werden wir beschreiben.

Suggy – Der Anfang

February 15th, 2011 by Thomas No comments »

So vielfältig wie die Menschen selbst sind auch ihre Interessen und Informationsbedürfnisse. Im digitalen Zeitalter sind fast alle Informationen fast überall und immer verfügbar. Dies macht es aber auch schwierig, genau das zu finden, was den eigenen Bedürfnissen und Interessen entspricht. Es ist also weniger eine Frage der Verfügbarkeit als der Auffindbarkeit von Informationen (mspro hat das Themen bei ctrl-verlust.net letztens erst aus einer anderen Perspektive beleuchtet).

Sprache und Bedeutung

Die menschliche Sprache ist etwas Wunderbares – sie ist nur nicht geeignet um mit Computern zu kommunizieren. Wir können unsere Wünsche, Gedanken, Fragen nur in Worten konkret ausdrücken Gesprochen, geschrieben oder auch in Gebärdensprache – Worte beschreiben unser Denken. Für einen Computer sind sie jedoch nichts anderes als Zeichenfolgen. Und genau das führt zu einem Problem:

Suchmechanismen

Die Informationsbeschaffung funktioniert im Moment vorrangig so:

  1. man benötigt eine möglichst konkrete Fragestellung bzw. Vorstellung was genau man sucht
  2. das Gesuchte wir mittels weniger Begriffe beschrieben
  3. ein Algorithmus durchsucht Datenbestände nach Übereinstimmungen mit diesen Begriffen und stellt die gewünschten Informationen bereit. Das können Webseiten, Personen, Bilder und vieles mehr sein.

Will man beispielsweise irgendetwas über Jimi Hendrix erfahren genügt es, in einer Suchmaschine nach „Jimi Hendrix“ zu suchen – sucht man Leute, die sich irgendwie für Jimi Hendrix interessieren, sucht man in Netzwerken nach Leuten, die „Jimi Hendrix“ in ihren Interessen haben.

Erste Probleme ergeben sich aber, wenn man spezielleren Informationen sucht. Denn mit der Komplexität der Fragestellung steigt auch die Anzahl der Begriffe, die benötigt werden , diese Frage zu beschreiben. Dies wiederum führt zu einer interessanten Entwicklung: Je mehr Begriffe verwendet werden, desto genauer wird das Thema zwar beschrieben, aber gleichzeitig aufgrund der Kombinationsmöglichkeiten der Worte immer mehr Interpretationen möglich.

Beispiel

Es ist, als wollte man dieses Bild

damit beschreiben:

Zwar kommen alle Begriffe im Beispiel vor, treffen aber auch hierauf zu:

und lassen sich auch so interpretieren:

Die Interessen eines Menschen lassen sich ungleich schwieriger beschreiben als ein einfaches Bild – sie sind zu komplex und zu umfassend, um sie mittels der herkömmlichen Methoden zu erfassen. Dementsprechend wird kein Nutzer als Ganzes betreut, sondern muss immer wieder einzelne Aspekte seiner Interessengebiete abgrenzen, in Suchbegriffe pressen und in verschiedensten Quellen suchen, was ihn interessiert.

Um dieses Problem zu lösen und die Nutzer aus diesem Abfragekorsett zu befreien, haben wir Suggy geschaffen.

Im nächsten Artikel:

Die Interessen von Menschen sind ebenso komplex wie wandelbar. Um sie für Mensch und Maschine gleichermaßen verständlich zu beschreiben greifen wir auf einen kleinen Trick zurück.

Bildquelle “Pfirsiche und Wein”: Vlad Tsirushkin unter Creative Commons

Suggy wird erwachsen

February 11th, 2011 by Thomas No comments »

Nach fast zwei Jahren Forschung und Entwicklung ist es soweit. Suggy wird im März online gehen. In den vergangenen zwei Jahren ist viel passiert. Wir haben Höhen und Tiefen erlebt, großartige Herausforderungen und herbe Rückschläge – jetzt freuen wir uns darauf, unser Projekt der Öffentlichkeit vorzustellen.

In den nächsten Tagen werden wir hier (etwas ernsthafter als bisher) darüber berichten, wie Suggy entstanden ist, was Suggy alles kann und wie es funktioniert.

Suggy-Crawler durchsucht das Internet

January 12th, 2011 by Thomas No comments »

Nachdem unsere Server angeschlossen sind und laufen, habe wir auch den Suggy-Crawler wieder gestartet. Dieser Teil von Suggy ist ein kleines Programm, dass von Link zu Link springt und die Inhalte an die Suggy-Server zur Auswertung schickt.

Im Klartext bedeutet das: Mehr Webvorschläge für unsere Nutzer!

Detailinformationen zum Suggy-Crawler gibt es hier >>>