KI hebt Sprachverarbeitung auf neues Level

Posted by Julia Werner  • 

Was ist künstliche Intelligenz (KI)? — Amazon Web Services

Künstliche Intelligenz (AI) ist der Bereich der Informatik, der sich mit dem Erwerb kognitiver Fähigkeiten beschäftigt, die in der Regel menschlicher Intelligenz zugeordnet werden. Hierzu zählen Lernen, Problemlösung und Mustererkennung. Künstliche Intelligenz, zu Englisch "Artificial Intelligence" und oft mit "AI" abgekürzt, wird häufig mit Robotern oder futuristischen Szenen in Verbindung gebracht. Jedoch geht AI weit über die Automaten der Science Fiction hinaus und bereichert sehr wohl auch die Nicht-Fiktion der modernen Informatik. Professor Pedro Domingos, ein bekannter Forscher auf diesem Gebiet, profiliert "fünf Stämme" des maschinellen Lernens: den der Logik und Philosophie verhafteten Symbolismus, den aus den Neurowissenschaften entstammenden Konnektionismus, den der Evolutionsbiologie nahen Evolutionismus, den mit Statistiken und Wahrscheinlichkeiten arbeitenden Bayesianismus und den der Psychologie angelehnten Analogismus. Neue, effizientere Methoden der statistischen Berechnung haben Bayesianern in den letzten Jahren Fortschritte in verschiedenen Bereichen beschert, die unter der Bezeichnung "maschinelles Lernen" zusammengefasst werden. Ähnlich haben Fortschritte im Netzwerkcomputing auf dem Gebiet des Konnektionismus zu einer Weiterentwicklung in einer Teildomäne unter dem Namen "Deep Learning" geführt. Maschinelles Lernen (ML) und Deep Learning (DL) sind beides Bereiche der Informatik, die der Disziplin der künstlichen Intelligenz verbunden sind.

Im Allgemeinen unterteilen sich diese Techniken in "überwachte" und "nicht überwachte" Techniken, wobei bei den überwachten Techniken auch Trainingsdaten mit der gewünschten Ausgabe verwendet werden, bei den nicht überwachten Techniken die gewünschte Ausgabe hingegen fehlt.

AI wird intelligenter und lernt schneller, je mehr Daten zur Verfügung stehen. Der Treibstoff aber, der maschinelle und Deep Learning-Lösungen befeuert, wird tagtäglich durch Unternehmen generiert, ob die Daten nun aus Data Warehouses wie Amazon Redshift extrahiert oder mit Mechanical Turk durch die "Macht der Masse" statistisch auf Herz und Nieren geprüft oder dynamisch mittels Data Mining durch Kinesis Streams abgeschöpft werden. Durch die Schaffung des Internet of Things (IoT) trägt schließlich auch die Sensortechnologie exponentiell zur Menge der analysierten Daten bei – Daten, die nun aus bislang nahezu unberührten Quellen, Orten, Objekten und Ereignissen nur so sprudeln.

Künstliche Intelligenz: Mit Geräten plaudern wie in der Science Fiction

Erst klingt der Dialog über Liebe ganz alltäglich. Doch dann sagt „Hal“ in dem Youtube-Video des Informatikers Alif Jakir: „Ich glaube, dass man absolut jeden lieben kann, egal wer er ist.“

Spätestens jetzt wirkt das Gespräch unnatürlich, obwohl die künstlich generierten Gesichter echt aussehen. Denn auch das Gespräch selbst ist synthetisch, erzeugt von einer speziellen Art künstlicher Intelligenz (KI), einem so genannten „Sprachmodell“.

Es heißt „GPT-3“ und hat im letzten Jahr die Welt verblüfft, der australische Sprachphilosoph David Chalmers wollte in der mit Eloquenz gepaarten Vielseitigkeit von GPT-3 sogar Anzeichen einer menschenähnlichen Intelligenz erkennen.

Deutsche Forscher wollen es mit den Tech-Giganten aufnehmen

GPT-3, entwickelt von der kalifornischen Firma OpenAI, war damals das rechenstärkste Sprachmodell. Es produziert selbständig Texte, die sich lesen, wie von Menschen verfasst. Wortgewandt behandelt die KI beliebige Themen, beantwortet Fragen, schreibt Geschichten, Dialoge oder Gedichte, übersetzt oder wandelt Alltagssprache in Programmiercode.

Das Sprachmodell zeigte, dass KI ein recht breites Wissen über die Welt lernen und ausdrücken kann. Ein Qualitätssprung, der einen Wettlauf um noch rechenstärkere Sprachmodelle ausgelöst hat, an dem sich große US-amerikanische Techfirmen wie Google oder der Chiphersteller Nvidia beteiligen. Im Sommer trat China, das sich als zweite KI-Macht neben den USA positionieren will, mit seinem Sprachmodell „Wu Dao 2.0“ in das Rennen ein. Im Dezember stellte die britische Google-Schwester Deepmind ihr Sprachmodell „Retro“ vor, das in einer externen Text-Datenbank „spickt“, wodurch Rechenkraft eingespart werden soll. Jetzt erhält der Wettlauf einen unerwarteten neuen Teilnehmer: Deutschland.

„Sprachmodelle sind eine entscheidende Entwicklung“, sagt Jörg Bienert vom KI-Bundesverband, ein Netzwerk aus deutschen KI-Unternehmen und -Experten. Sie seien Basis für eine ganze Reihe von Anwendungen wie Chatbots oder automatisches Auswerten von Dokumenten.

Mit dem Netz sprechen wie mit einem Freund

„Menschen werden immer natürlicher mit Computern sprechen“, ergänzt Jessica Heesen, Medienethikerin an der Universität Tübingen. Ein Dialog zwischen Mensch und Smartphone könnte sich dann so anhören: „Finde bitte das Dokument, das ich für den Vortrag am Samstag erstellt habe.“ Das Handy fragt nach: „Meinst du das mit der Umsatzgrafik drin?“ Sprachmodelle könnten zur Benutzeroberfläche des Netzes werden. „Wer Computer sprechfähig macht, wird eine große Vormachtstellung auf dem Markt haben“, meint Heesen.

KI hebt Sprachverarbeitung auf neues Level

Ob Smartphone oder Maschine – es wird immer geläufiger, sich mit Geräten zu unterhalten: Die Spracheingabe und -ausgabe ist dank Künstlicher Intelligenz im Alltag angekommen. Das Potenzial für Unternehmen liegt jedoch besonders im Verstehen von Schrift durch Computer. So können sie Rechnungen automatisiert prüfen oder Freitextfelder in Feedbackbögen auswerten und damit Arbeitsprozesse effizienter gestalten.

Sprechen statt tippen: Wir werden immer vertrauter damit, Smartphones und andere Geräte per Sprache zu steuern. Laut einer Befragung des Digitalverbands Bitkom griffen im Jahr 2020 schon 39 Prozent der Internetnutzer auf intelligente Sprachassistenten zurück. Diese kommen insbesondere am Smartphone (66 Prozent) und am Tablet (41 Prozent) zum Einsatz – sei es, um einen Anruf aufzubauen, eine Sprachnachricht zu diktieren, nach dem Wetter zu fragen oder den Smart-TV zu steuern. Möglich wird diese Entwicklung durch Künstliche Intelligenz. Sie bildet die Grundlage dafür, dass Smartphone und Co. überhaupt verstehen, was der Nutzer sagt.

Und die Intelligenz der digitalen Assistenten wächst weiter – auch weil die Forschung zur natürlichen Sprachverarbeitung große Fortschritte macht und die Technologie immer ausgereifter wird. Die gewonnenen Erkenntnisse bieten besonders für Unternehmen Potenzial: Sie können von der Spracheingabe profitieren und darüber etwa Maschinen steuern. Eine verbesserte Spracheingabe eröffnet zudem die Möglichkeit, die Sprache selbst als Analyseobjekt in Form von Schrift zu nutzen.

Arbeitsprozesse durch Künstliche Intelligenz verkürzen

Broschüre Künstliche Intelligenz Broschüre Künstliche Intelligenz

pdf, 873 KB Verschaffen Sie sich in unserer Broschüre einen Überblick über wichtige Aspekte der Künstlichen Intelligenz, über Funktionsweisen, Lernverfahren, Voraussetzungen und auch die Grenzen von KI.

Dank fortgeschrittener Sprachverarbeitung lassen sich stochastische Zusammenhänge untersuchen, häufige Wortkombinationen analysieren, verschiedene Dokumente gruppieren und mehreren Klassen zuordnen. Sogar einzelne Textpassagen in Dokumenten können nun über Tausende Bücher hinweg abgeglichen werden. Konkret bedeutet das: Computer sind beispielsweise in der Lage, Rechnungen automatisiert zu prüfen oder Freitextfelder in Feedbackbögen auszuwerten. So verkürzen Unternehmen zum einen eintönige Arbeitsprozesse und haben die Möglichkeit, die Ressourcen für andere Aufgaben einzusetzen. Zum anderen können sie mithilfe Künstlicher Intelligenz viel leichter Kundenmeinungen aus unterschiedlichen Quellen automatisiert sammeln und Informationen extrahieren. Die Ergebnisse helfen dabei, Kundenfeedback schneller aufzunehmen und dadurch die Kundenbeziehung zu verbessern.

Beim Abgleich von Dokumenten gehen die Möglichkeiten der Sprachverarbeitung über die einer Suchmaschine hinaus. Da die Textpassagen auch verstanden werden, können sogar komplett umformulierte Passagen mit übereinstimmendem Inhalt entdeckt werden. Einsatzszenarien sind hier die automatisierte Patentsuche, das Sichten von Gesetzestexten oder die Kategorisierung von Reparaturanleitungen.

Vorhandene Spracheingabe- und Sprachausgabeprogramme nutzen

Obwohl die technologischen Voraussetzungen gegeben sind, stehen viele Unternehmen bei der Nutzung der Sprachverarbeitung noch am Anfang. Geht es um die Analyse von Texten mithilfe Künstlicher Intelligenz, können sie jedoch auf bereits vorhandene Lösungen aus der Wissenschaft zurückgreifen. Lufthansa Industry Solutions berät bei der Auswahl bestehender Spracheingabe- und Sprachausgabeprogramme und bei den entsprechenden Analysemodellen zum Sprach- und Textverständnis aus den Bereichen der Künstlichen Intelligenz.

Tagged:

  • Sprache der künstlichen Intelligenz
  • Leave a Reply