Tags: sage, KI, Algorithmus, VLB Klassifizierung
Autor/in: Linda Rachel Erni
Für diesen Text benötigst du etwa 2 Minuten
Scriptbakery, unsere Software für das Management und die Analyse von Texten aller Art, befindet sich in einem stetigen Lernprozess. Und damit meinen wir das Wort „lernen“ buchstäblich. Denn unsere integrierte Künstliche Intelligenz ALINEA lernt mit jeder neuen Funktion dazu.
Das neueste Feature ist ein optimierter Algorithmus namens SaGe, den wir speziell für die Klassifizierungsdaten des VlB selbst entwickelt haben. Er kann die Subjects (Thema-Inhalte) und bald auch die Qualifier (Thema-Zusätze) automatisch und in wenigen Millisekunden einem neuen Manuskript zuordnen. Damit entfällt die bisher zeitintensive und oft von Menschen getane Arbeit, geeignete Classifier aus dem großen Fundus (8.200 Kategorien, immerhin 2665 allein für die Genre-Klassifizierung) auszuwählen. Stattdessen werden die passenden Subjects und Qualifier für ein neues Manuskript vorgeschlagen – und das mit einer unglaublichen Genauigkeit von 98,7%.
Besser und zielgerichteter vermarkten
Die Einordnung von Manuskripten im Speziellen ist heutzutage absolut unerlässlich für Buchverkäufe, die Auffindbarkeit von Büchern und zielgerichtetes Marketing. Denn je genauer und zahlreicher Genres einem Text zugeordnet werden, desto besser kann er vom Handel platziert werden. Online und offline. Aufgrund des aufwendigen Verfahrens und weniger zuverlässigen Algorithmen, war bisher viel Luft nach oben im Bereich der Subject- und Qualifier-Zuordnung. Diesen „Hohlraum“ können Verlage mit Scriptbakery und SaGe jetzt effektiv füllen.
Um die Zuverlässigkeit von SaGe zu prüfen, haben wir den Datenbestand bereits klassifizierter Bücher in zwei Kategorien aufgeteilt: Trainingsdaten, an denen SaGe lernen kann, welche Muster, Wortumgebungen und Tonalitäten den verschiedenen Subjects eigen sind. Und Testdaten, an denen SaGe sich versuchen darf, Subjects selbstständig zuzuordnen. Das hat den großen Vorteil, dass überprüfbar wird, wie zuverlässig SaGe die Zuordnungen vornimmt.
Ein Beispiel unserer Überprüfung der Genauigkeit und Zuverlässigkeit:
„Guitar Basics“ werden ebenso wie das Original unter dem Subject „Gitarren“ klassifiziert, „Neugeborenes – Skills für Hebammen“ bekommt von SaGe direkt vier Thema-Inhalte zugeordnet, die genauso auch händisch zugeordnet wurden. Das Buch mit dem Titel „Mediationserlebnis“ erkennt SaGe allein aufgrund des Klappentextes als „Lebenshilfe, Persönlichkeitsentwicklung und praktische Tipps“ – im VlB hingegen wurde es als „Fitness und Ernährung“ klassifiziert. Ein Fehler – oder hat hier der Algorithmus den passgenaueren Vorschlag gemacht?
SaGe ist flexibel und lernfähig
Nicht nur die Verlagsbranche kann von unserem optimierten und selbst entwickelten Algorithmus profitieren. SaGe ist flexibel für sämtliche Unternehmen einsetzbar, die Bedarf nach einer sehr zuverlässigen Klassifizierung von Inhalten haben. Dabei spielt es für das Anlernen keine Rolle, ob es sich um ein Medienhaus oder eine Immobilienfirma handelt. SaGe klassifiziert dort, wo Inhalte zielsicher bestimmt werden sollen.