Automatisierte Textzusammenfassung dank Schweizer Software GetDigest

In Zeiten der Informationsflut wird es immer schwieriger einen Überblick zu behalten. Ein Executive Summary kann hierzu eine gute Hilfe sein. Die Schweizer Firma Hulbee geht sogar noch einen Schritt weiter. Sie hat die Software GetDigest entwickelt, die dank künstlicher Intelligenz und Algorithmen, lange Texte zusammenfassen kann. CEO Andreas Wiebe erklärt was GetDigest so alles kann.

Herr Wiebe, ob im Studium oder im Berufsleben, Texte zusammenfassen ist nicht gerade die beliebteste Beschäftigung. Wie sind Sie auf die Idee zu GetDigest gekommen?

Die Idee hatte ich bereits im Studium. Jeder Schüler oder Student, der viel liest und nicht unbedingt die Geduld dazu hat das Buch durchzulesen träumt von einer Zusammenfassung. So war es auch bei mir. Bevor es jedoch zu einer sichtbaren Technologie geworden ist, hat es Jahre gebraucht. Die erste Version entstand im Jahr 2002.

Das Logo von GetDigest (c) GetDigest

Wie funktioniert GetDigest?

Es ist eine komplexere Software Technologie aus dem Bereich der künstlichen Intelligenz. Unkompliziert dargestellt, besteht die Technologie aus:

  1. Wissensdatenbank
  2. Thesaurus Datenbank
  3. Semantik
  4. Sprachen-Bibliothek und jeder Menge Algorithmen  

Sinn und Zweck verläuft im Groben wie beim Menschen. Wir füttern die Wissensdatenbank erst einmal mit vielen Informationen aus verschiedenen Themen (Medizin, Computertechnik, Theologie, Technik usw.). Die Software beginnt zu lernen, dabei soll unter anderem ein bestehender Thesaurus erweitert werden. Somit kann z.B. die Software erkennen, ob beim Wort „Maus“ über die Tierwelt oder Computertechnik gesprochen wird. Ebenso wird jede „Müll Information“ z.B. Artikel wie der/die/das aussortiert, da sie kein Wissen mit sich trägt. Jedes Wort wird analysiert und mit Hilfe von KI (=Künstlicher Intelligenz) und Statistik verglichen und erst dann die Zusammenfassung erstellt. Die Technologie „erkennt“ was somit die wichtigste Information ist, in einem jeweiligen Zusammenhang. Um die heutigen Ergebnisse zu liefern, mussten wir der Software erst einmal Unmengen an Daten zum „Füttern“ geben. Wenn wir es mit dem Menschen vergleichen, so ist es wie ein Kind, das mit dem Wachstum klüger wird. Jedoch geht es hier in beinahe alle Bereiche des menschlichen Lebens und das extrem schnell! Es bedarf hier natürlich ausser der Software auch super starker Computer, um die Rechenprozesse schnell verarbeiten zu können. Dazu nutzen wir Dutzend Server in unserem Data Center in der Schweiz. Übrigens ist der sprachliche Akzent auch sehr wichtig, somit kann die Technologie Informationen in mehr als 30 Sprachen „verstehen“.

Gerade im wissenschaftlichen Bereich sind die Texte komplex. Ist dies für GetDigest ein Problem?

Gerade weil wir selber wissenschaftlich orientiert sind, dienten gerade wissenschaftliche Inhalte für die Technologie GetDigest als Basis. Demnach können wir beinahe alle wissenschaftlichen Texte analysieren – und das in allen Themenbereichen.

Eine eigene Zusammenfassung hat einen gewissen Lerneffekt. Wo liegen die Vorteile der automatisierten Form?

Wir haben GetDigest nicht für die Faulsäcke gemacht, sondern für Menschen, die viele Informationen in kurzer Zeit verarbeiten müssen.

Wenn ein Student, Wissenschaftler oder ein Manager dringend Ergebnisse benötigt, um eine Entscheidung zu treffen, dann benötigt er Fakten, die auf vielen Informationsquellen basieren. Oder bevor man das eine oder das andere Buch liest, möchte man, ohne viel Zeitverlust, die Executive Summary erhalten.

Somit ist GetDigest geeignet für Menschen die lernen wollen oder auch müssen, und dabei ein Hilfswerkzeug benötigen, um weiter zu kommen.

Dank künstlicher Intelligenz Texte zusammenfassen (c) GetDigest

Damit die Software optimal funktioniert, muss sie ständig lernen. Wie wird das bei Ihnen umgesetzt?

Die Technologie wird stets in unserem Labor weiterentwickelt und perfektioniert. Unsere Technologie von GetDigest lernt zum Beispiel durch künstliche Intelligenz. GetDigest wird mit Informationen „gefüttert“, um aktuell zu bleiben, somit lernt es wie ein Schüler jeden Tag und erweitert das „eigene Wissen“.

Die markierten Schlüsselwörter (c) GetDigest

Wer soll GetDigest nutzen und wie kommt man an diese Software?

Die Technologie versteht beinahe alle beruflichen Richtungen, ob Manager, CEO, Projektleiter, Lehrer, Juristen, Behörden, Wissenschaftler, Studenten oder sogar Schüler – jeder kann auf das Wissen der Technologie kostenlos zugreifen.

Wir benutzen es zum Beispiel bei der ersten Voranalyse von wissenschaftlichen Texten, um die typische Executive Summary zu erhalten. Da wir uns in einem extremen  Informationswachstum befinden, müssen wir viel und schnell Informationen analysieren und auch Entscheidungen treffen. Übrigens ist es ein sehr gutes Werkzeug für die SEO-Analysten.

Jedoch ist unser Ziel mit der Industrie oder auch jeder Lehreinrichtung wie z.B. Fachhochschulen, Universitäten usw. zusammenzuarbeiten und eine neue Art der Wissensbibliothek aufzubauen. In dieser Bibliothek sollen alle wissenschaftlichen Informationen und Bücher analysiert werden und semantisch miteinander verknüpft werden. Das würde eine neue Art von Knowledge-Wikipedia sein. Ebenso das Wissen eines Unternehmens auf eine völlig neue Basis heben.

Beispieltext von GetDigest (c) GetDigest

Nutzen Sie für die Vermarktung von GetDigest Marketinginstrumente?

Derzeit noch nicht. Wir beschränken uns derzeit nur auf die Pressepublikationen und hoffen natürlich, dass die Mundpropaganda mithilft.

Durch die Digitalisierung ist die Information ständig verfügbar. Das Volumen allerdings wird immer grösser, auch für die Unternehmen. Wenn Sie in die Zukunft schauen, was wird auf dem Gebiet von neuronaler Software alles möglich sein?

Genau das ist unsere grosse Herausforderung! Ich bin der Meinung, dass die Softwaretechnologie soweit kommen muss, dass es nicht nur die Textinformationen, sondern die wesentlichen vier Informationsbereiche „verstehen müsste“: 1. Information in Textform, 2. Bild, 3. Video und 4.Voice, sobald diese Bereiche ohne grosse wesentliche Einschränkung analysiert werden können, natürlich mit brauchbaren Resultaten, dann können wir über den wirklichen Durchbruch in der IT-Welt sprechen. Derzeit sind die meisten Unternehmen noch in den alten Strukturen am Kämpfen. Wenn wir allein die Informationssuche anschauen, ob im Web -oder in den Unternehmen, es ist doch alles andere als intelligent, selbst Google ist weit davon entfernt. Dabei reden wir NUR über die Informationsquelle „Text“.

Wir versuchen ja auch unsere Projekte wie zum Beispiel die semantische Suchmaschine www.swisscows.ch oder www.hulbee.com genau in diese Richtung zu positionieren. Nichtsdestotrotz bin ich sicher, dass in einer Zukunft von etwa 20-30 Jahren das semantische Internet kommen wird. Es wird andere Art von Wissen sein, als das das wir heute kennen.

http://getdigest.ch/

https://company.hulbee.com/