Start-up bringt KI afrikanische Sprachen bei

Viele Sprachmodelle sind für Sprachen mit geringerer Sprecheranzahl nicht gut geeignet. Das Start-up Lelapa AI setzt bei afrikanischen Sprachen an.​

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Ein weiblich anmutender Roboter sitzt vor einem Mischpult mit Bildschirmen und singt oder spricht in ein Mikrofon

(Bild: Bild: KI Stable Diffusion | Bearbeitung c't)

Lesezeit: 6 Min.
Von
  • Abdullahi Tsanni
Inhaltsverzeichnis

In einem Co-Working Space im Rosebank-Viertel von Johannesburg öffnete die Informatikerin Jade Abbott ein neues Fenster auf ihrem Computer und forderte ChatGPT auf, in isiZulu von eins bis zehn zu zählen. Das ist die Sprache, die von mehr als zehn Millionen Menschen in ihrer Heimat Südafrika gesprochen wird. Die Ergebnisse waren "gemischt und lustig", berichtet Abbott.

Dann tippte sie ein paar Sätze in isiZulu ein und bat den Chatbot, sie ins Englische zu übersetzen. Auch diesmal waren die Antworten nicht einmal annähernd richtig. Obwohl es Bemühungen gibt, bestimmte Sprachen in KI-Modelle einzubeziehen, selbst wenn nur wenige Daten für das Training zur Verfügung stehen, zeigen diese Ergebnisse für Abbott, dass die Technologie "unsere Sprachen noch immer nicht wirklich erfasst".

Ihre Erfahrung spiegelt die Situation von Afrikanern wider, die kein Englisch sprechen. Viele Sprachmodelle wie ChatGPT sind für Sprachen mit einer geringeren Anzahl von Sprechern, insbesondere für afrikanische Sprachen, nicht gut geeignet. Deshalb versuchen Abbott und die Biomedizintechnikerin Pelonomi Moiloa, in ihrem neuen Start-up Lelapa AI mithilfe von maschinellem Lernen Werkzeuge zu entwickeln, die speziell für Afrikaner geeignet sind.

Das neue KI-Tool Vulavula, das Lelapa AI Mitte November vorgestellt hat, wandelt Sprache in Text um und erkennt Namen von Personen und Orten in geschriebenen Texten. Die letzte Funktion könnte für die Zusammenfassung eines Dokuments oder die Online-Suche nach einer Person nützlich sein. Zurzeit kann es vier in Südafrika gesprochene Sprachen erkennen: isiZulu, Afrikaans, Sesotho und Englisch. Darüber hinaus arbeitet das Team daran, weitere Sprachen aus ganz Afrika einzubeziehen.

Das Tool lässt sich eigenständig verwenden oder in bestehende KI-Tools wie ChatGPT und Online-Chatbots integrieren. Das Team hofft, dass Vulavula, was auf Xitsonga "sprechen" bedeutet, auch all jene Tools zugänglich machen wird, die derzeit keine afrikanischen Sprachen unterstützen.

Das Fehlen von KI-Tools, die für afrikanische Sprachen funktionieren und afrikanische Namen und Orte erkennen, schließt afrikanische Menschen von wirtschaftlichen Möglichkeiten aus, sagt Moiloa, CEO und Mitbegründerin von Lelapa AI. Für sie ist die Arbeit an afrikazentrierten KI-Lösungen ein Weg, um anderen in Afrika zu helfen, die immensen potenziellen Vorteile von KI-Technologien zu nutzen. "Wir versuchen, echte Probleme zu lösen und die Macht wieder in die Hände der Menschen zu legen", sagt sie.

Es gibt Tausende von Sprachen auf der Welt, allein 1.000 bis 2.000 davon werden in Afrika gesprochen: Man schätzt, dass auf dem Kontinent ein Drittel aller Sprachen der Welt gesprochen wird. Doch obwohl nur fünf Prozent der Weltbevölkerung Englisch als Muttersprache haben, dominiert diese Sprache das Internet – und inzwischen auch die KI-Tools.

Es gibt bereits einige Bemühungen, dieses Ungleichgewicht zu korrigieren. OpenAIs GPT-4 hat kleinere Sprachen wie Isländisch einbezogen. Seit Februar 2020 unterstützt Google Translate fünf neue Sprachen, die von etwa 75 Millionen Menschen gesprochen werden. Aber die Übersetzungen sind oberflächlich, das Tool versteht afrikanische Sprachen oft falsch, und es ist noch weit entfernt von einer genauen digitalen Darstellung afrikanischer Sprachen, sagen afrikanische KI-Forscher.

Anfang dieses Jahres führte der äthiopische Informatiker Asmelash Teka Hadgu auf einer führenden afrikanischen KI-Konferenz in Kigali, Ruanda, die gleichen Experimente durch, die Abbott mit ChatGPT durchgeführt hatte. Als er dem Chatbot Fragen in seiner Muttersprache Tigrinya stellte, waren die Antworten, die er erhielt, Kauderwelsch. "Er generierte Wörter, die keinen Sinn ergaben", sagt Hadgu, der das in Berlin ansässiges KI-Startup Lesan mitbegründet hat, das Übersetzungstools für äthiopische Sprachen entwickelt.

Lelapa AI und Lesan sind nur zwei der Start-ups, die Spracherkennungstools für afrikanische Sprachen entwickeln. Im Februar erhielt Lelapa AI eine Startfinanzierung in Höhe von 2,5 Millionen Dollar. Die nächste Finanzierungsrunde ist für 2025 geplant. Viele afrikanische Unternehmer sagen allerdings, dass sie auf große Hürden stoßen: fehlende Finanzmittel, begrenzter Zugang zu Investoren und Schwierigkeiten bei der Schulung von KI zum Erlernen verschiedener afrikanischer Sprachen. "KI wird von den afrikanischen Start-ups am wenigsten finanziert", sagt Abake Adenle, der Gründer des Londoner Startups Ajala, das Sprachautomatisierung für afrikanische Sprachen anbietet.

KI-Startups, die an der Entwicklung von Produkten für afrikanische Sprachen arbeiten, werden laut Hadgu von den Investoren oft ignoriert, weil der potenzielle Markt klein ist, es an politischer Unterstützung mangelt und die Internet-Infrastruktur schlecht ist. Hadgu sagt jedoch, dass kleine afrikanische Start-ups wie Lesan, GhanaNLP und Lelapa AI eine wichtige Rolle spielen: "Große Tech-Unternehmen widmen unseren Sprachen keine Aufmerksamkeit", sagt er, "aber wir können nicht auf sie warten."

Lelapa AI versucht, ein neues Paradigma für KI-Modelle in Afrika zu schaffen, sagt Vukosi Marivate, ein Datenwissenschaftler im KI-Team des Unternehmens. Anstatt wie westliche Unternehmen nur das Internet zu nutzen, um Daten zum Trainieren des Modells zu sammeln, arbeitet Lelapa AI sowohl online als auch offline mit Linguisten und lokalen Gemeinschaften zusammen, um Daten zu sammeln, sie zu kommentieren und Anwendungsfälle zu identifizieren, in denen das Tool problematisch sein könnte.

Bonaventure Dossou, ein auf die Verarbeitung natürlicher Sprache (NLP) spezialisierter Forscher bei Lelapa AI, sagt, dass die Zusammenarbeit mit Linguisten die Entwicklung eines kontextspezifischen und kulturell relevanten Modells ermöglicht. "Die Einbindung kultureller Sensibilität und sprachlicher Perspektiven macht das technische System besser", sagt Dossou. So hat das KI-Team von Lelapa AI beispielsweise Algorithmen zur Analyse der Stimmung und des Tons entwickelt, die auf bestimmte Sprachen zugeschnitten sind.

Marivate und seine Kollegen bei Lelapa AI stellen sich eine Zukunft vor, in der KI-Technologien für Afrikaner arbeiten und diese vertreten. 2019 gründeten Marivate und Abbott Masakhane, eine Basisinitiative, die NLP-Forschung (Natural Language Processing) in afrikanischen Sprachen fördern soll. Inzwischen arbeiten Tausende von Freiwilligen, Programmierern und Forschern zusammen, um NLP-Modelle für Afrika zu entwickeln.

Es ist wichtig, dass Vulavula und andere KI-Tools von Afrikanern für Afrikaner entwickelt werden, sagt Moiloa: "Wir sind die Hüter unserer Sprachen. Wir sollten die Entwickler von Technologien sein, die für unsere Sprachen funktionieren."

(vsz)