Donnerstag, 26. Dezember 2024

BürgerassistenzEffektive Unterstützung

[25.07.2024] Als Bürgerassistenz bleiben die typischen, regelbasierten KI-Bots hinter den Erwartungen zurück. Das Fraunhofer-Institut FOKUS hat untersucht, wie diese besser werden können – etwa indem Online-Dienste und Formulare mit Sprach-Schnittstellen erweitert werden.
Der Hamburger Kindergeld-Service hat einen Sprachassistenten.

Der Hamburger Kindergeld-Service hat einen Sprachassistenten.

(Bildquelle: Fraunhofer FOKUS, Philipp Plum)

KI-Lösungen gewinnen auch in der öffentlichen Verwaltung immer mehr an Bedeutung. So können Machine-Learning-Verfahren den Posteingang einer Behörde vorsortieren und ihn verschiedenen Dienststellen zuweisen. Generative Sprachmodelle – auch Large Language Models (LLM) genannt – sind durch ChatGPT populär geworden. Solche LLMs können nicht nur Texte erzeugen, sondern sie auch analysieren. Sie können Eingaben deutlich besser verstehen als frühere KI-Technologien. In Gestalt von Retrieval-Augmented-Generation-Chatbots (RAG-Chatbots) erlauben generative KI-Modelle hochqualitative Suchverfahren für die öffentliche Verwaltung, indem interne Datenbestände nutzerfreundlich und zielgenau im Frage-Antwort-Modus erschlossen werden. In der Verwaltung können sie dazu beitragen, Mitarbeitende von repetitiven Aufgaben zu entlasten und die digitale Kommunikation an der Bürgerschnittstelle zu unterstützen.

Neue, nutzerfreundliche Kommunikation

Infolge von Kostenzwängen und dem Fachkräftemangel steht bei Diskussionen einer möglichen KI-Anwendung die Unterstützung interner Fachprozesse im Vordergrund. Moderne KI-Verfahren können aber noch mehr: Sie eröffnen neue, nutzerfreundliche Möglichkeiten der Kommunikation mit Bürgerinnen und Bürgern und tragen dazu bei, Barrieren zu reduzieren. Bisher ist die Popularität von Chatbots an der Bürgerschnittstelle eher begrenzt. Einerseits hat der ChatGPT-Hype hohe Nutzer­erwartungen geweckt, die typische Verwaltungsbots oft nicht erfüllen können, da sie auf älteren Suchtechnologien basieren. Andererseits sind diese Systeme bisher meist auf die reine Informationsbeschaffung limitiert. Um einen digitalen Antrag zu stellen, muss man den Chat verlassen und – ohne Bot-Hilfe – den Weg über ein (Online-)Formular gehen.

Kommunikationsbandbreite erhalten

Formulare sind und bleiben unverzichtbar. Sie stellen genau durchdachte, formalisierte Schnittstellenspezifikationen zwischen Bürgerinnen und Bürgern sowie der Behörde dar. KI-Assistenzlösungen sollten idealerweise eine leistungsfähige Unterstützung beim Ausfüllen bieten. Dazu gehört es, Zwischenfragen zu Details eines Formulars entgegenzunehmen und zu beantworten. Dabei sollte das ausgefüllte Formular jederzeit sicht- und editierbar bleiben. Eine Interaktion per Audio oder ausschließlich im Chat-Fenster schränkt die Kommunikationsbandbreite aber ein, sodass wichtige Details übersehen werden könnten. Da durch die Formularabsendung oft Rechtsakte begründet werden, gilt es, dies zu vermeiden. Am Fraunhofer-Institut FOKUS wurde in einer Reihe von Projekten für die öffentliche Verwaltung untersucht, wie Online-Dienste und formularzentrische Web-Anwendungen effektiv und minimalinvasiv mit Chat- und Sprachschnittstellen erweitert werden können. So wurde in einem Pilotvorhaben mit der Freien und Hansestadt Hamburg und Dataport der dort betriebene Online-Dienst „Kinderleicht zum Kindergeld“ mit einem Sprachassistenten erweitert, der es ermöglicht, das komplexe Online-Formular vollständig sprachgesteuert auszufüllen. In Folgeprojekten wurde die Vorgehensweise auf andere Anwendungen übertragen und erweitert. Ein weiteres Beispiel ist das EU-Vorhaben ACROSS. Hier entstand ein multilingualer, multimodaler Bürgerassistent. Er soll Bürgerinnen und Bürger etwa dabei unterstützen, die formalen Vorbereitungen für einen längeren Auslandsaufenthalt abzuwickeln.

Chatbot beantwortet Hintergrundfragen

Der Assistent ermöglicht die Navigation einer zentralen Citizen Web App und das Ausfüllen von Eingabefeldern wahlweise per getipptem Chat oder per Spracheingabe. So demonstriert das Projekt erstmalig einen nahtlosen Wechsel zwischen dem Web-Assist-Modus zum Steuern, Navigieren und Ausfüllen und einem separaten Info-Chatbot, der Hintergrundfragen beantwortet. Zudem wurde eine erste Integration mit einem generativen KI-Modell realisiert, um das Textverstehen des Assistenten durch Natural Language Understanding (NLU) zu optimieren. Parallel hat Fraunhofer FOKUS den „FOKUS Intelligent Speech Assistant“ aufgebaut, das so genannte FISA-Framework. Dieses unterstützt eine einfache Erweiterung formularzentrischer Web-Anwendungen um konversationale KI-Assistenzfunktionen. In die neueste Version sind Open-Source-LLMs integriert. Diese Erfahrungen zeigen: Ein Full-Service-KI-Bürgerassistent ist denkbar. Dieser könnte einen modernen RAG-Info-Chatbot mit einem LLM-gestützten Formularassistenten kombinieren und so nahtlose Wechsel zwischen Unterstützungsformen und den Interaktionsmodi – Chat, Sprache sowie Web-UI-Nutzung – unterstützen und zudem mehrsprachig arbeiten. Die Vorteile: Informationen werden zielgenau gefunden, Nutzereingaben und -intentionen werden sowohl bei der Informationssuche als auch bei der eigentlichen Dienstnutzung besser verstanden, wodurch das Nutzerfrustrationsrisiko sinkt.

Sachlich falsche Inhalte vermeiden

Generative KI-Modelle bringen aber auch Risiken mit sich – vor allem das so genannte Halluzinieren, also die Generierung sachlich falscher Textinhalte. Es gibt bereits Forschungen, die zumindest mittelfristig Abhilfe versprechen. Im hier diskutierten Kontext gilt es, die Risiken angemessen zu mitigieren. Unproblematisch ist die NLU-Anwendung generativer KI-Modelle, da der erzeugte Text überwiegend systemintern verarbeitet wird. Beim Ausfüllen von Formularinhalten können Halluzinationen leicht bemerkt und korrigiert werden, da die Nutzer ausgefüllte Formulare einer Endkontrolle unterziehen. Größer sind die Herausforderungen im RAG-basierten Infochat. Hier könnte ein Lösungsansatz sein, als Suchergebnisse keine generierten Texte, sondern nur Ausschnitte aus Originaldokumenten auszugeben, etwa Teile von Behörden-Websites. In diesem Fall unterstützt das generative KI-Modell dann nur hinter den Kulissen Auswahl und Ranking ausgegebener Inhalte. Um die Anforderungen der Verwaltung hinsichtlich der Datensouveränität zu erfüllen, sollten generative KI-Modelle quelloffen sein und zudem einen On-Premises- oder Private-Cloud-Betrieb gestatten. Aktuelle Lösungen, die diese Bedingungen erfüllen, beschränken sich in der Regel ausschließlich auf die Textprozessierung. Ist die Verarbeitung gesprochener Sprache gewünscht, müssen Spracherkennungs- und Sprachsynthese-Komponenten integriert werden. Hinzu kommen in einigen Fällen Komponenten zur maschinellen Übersetzung.

Zukunft mit multimodalen Large Language Models

Auch für diese Teilaufgaben existieren bereits brauchbare Open-Source-Lösungen. In Zukunft ist jedoch auch mit multimodalen LLMs zu rechnen, die alle Teilaufgaben in einem einzigen Modell lösen und dadurch nur noch wenig Rechenzeit benötigen. Durch zügig gelieferte Antworten erscheinen sie für den Einsatz in interaktiven Assistenzlösungen besonders attraktiv. Ein solcher Full-Service-Bürger­assistent wird idealerweise das mit traditionellen Chatbots assoziierte Frustrationsrisiko durch besseres Textverständnis generativer KI-Modelle umschiffen und wird in der Lage sein, zwischen Informations- und Unterstützungsrolle zu wechseln. Die multilinguale Funktion und ein nahtloser Moduswechsel zwischen Sprach-, Chat- und klassischer Interaktion tragen dazu bei, Sprachbarrieren, aber auch sonstige Barrieren zu reduzieren.

Thilo Ernst und Khaled Sakallah sind wissenschaftliche Mitarbeiter beim Fraunhofer-Institut für Offene Kommunikationssysteme FOKUS.




Anzeige

Weitere Meldungen und Beiträge aus dem Bereich: IT-Infrastruktur
Blick auf Bad Bentheim von schräg oben.
bericht

Bad Bentheim: Arbeitsplatz in der Cloud

[18.12.2024] Die Stadt Bad Bentheim führt die cloudbasierte Arbeitsplatzlösung Microsoft 365 ein und verspricht sich davon effizientere und flexiblere Abläufe. Unterstützung bei der Einführung erhielt die Kommune durch ihren langjährigen IT-Dienstleister ITEBO. mehr...

Ein Mann mit VR-Brille hantiert mit ihn umgebenden Lichtwellen.
bericht

Virtuelle Realität: Die Zukunft beginnt jetzt

[27.11.2024] Technologien wie Virtual Reality (VR) und Augmented Reality (AR) eröffnen auch für Verwaltungen völlig neue Möglichkeiten. Erste Denkanstöße für potenzielle Einsatzgebiete in Kommunen will nun eine Arbeitsgruppe der KGSt erstellen. mehr...

Porträtbild von Dr. Andreas Wierse.
interview

Sicos BW: Offen für neue Technologien

[22.11.2024] Der Einsatz von Virtual Reality und Augmented Reality in der Verwaltung kann die Qualität von Entscheidungen deutlich verbessern, sagt Andreas Wierse. Kommune21 sprach mit dem Geschäftsführer von Sicos BW über die Einsatzmöglichkeiten der Technologie in Kommunen. mehr...

Screenshot des Headers zum Axians Infoma Innovationspreis 2024, der eine zur Faust geformte Hand zeigt, nur der ausgestreckte Zeigefinger tippt auf das Wort Innovation.

Axians Infoma: Der Innovationspreis 2024 ist vergeben 

[19.11.2024] Die Gewinner des Axians Infoma Innovationspreises 2024 stehen fest. Den Hauptpreis gewann die Kreisbaugruppe Rems-Murr-Kreis-Immobilien-Management für ihr digitales Schadensmanagement. Auch wurden zwei Finalisten aus Österreich und Niedersachsen geehrt. mehr...

Vektorgrafik mit stilisiert dargestellten Persone, die mit Puzzleteilen an einem Laptop hantieren.

Ceyoniq: Update für nscale

[05.11.2024] Mit Version 9.3 hat Softwareanbieter Ceyoniq das nächste Update seiner Content-Management-Lösung nscale veröffentlicht. Neuerungen gibt es unter anderem in der automatisierten Rechnungsverarbeitung, bei digitalen Signaturen, in den Grundfunktionen oder dem nscale-Webclient. mehr...

Kempen: IT-Safe ersetzt Serverraum

[15.10.2024] Mit der Onsite-Colocation-Lösung des Anbieters Prior1 kann die Stadt Kempen ihre Systeme künftig in einem hochsicheren IT-Safe betreiben. mehr...

Philipp Stolz
interview

Schorndorf: Wir Spinner aus der Digitalisierung

[10.10.2024] Als Chief Digital Officer (CDO) der Stadt Schorndorf in Baden-Württemberg hat Philipp Stolz ChatGPT eingeführt und für den Umgang damit eine Dienstanweisung verfasst. Die Mitarbeiter durchlaufen eine Schulung und sind begeistert. mehr...

Das Bild zeigt einen Bildschirm mit einer Ansicht des Programms disy Cadenza.

Disy/Ionos: Datensouveräne Umgebung

[07.10.2024] Das Karlsruher Unternehmen Disy Informationssysteme und der Cloudanbieter Ionos haben eine Kooperation gestartet, um innovative und datenschutzkonforme Software-as-a-Service-Lösungen anzubieten. mehr...

Die Guideline von Vitako und KGSt soll eine praxisnahe Orientierung für den Einsatz von generativer KI in Kommunalverwaltungen bieten.

Vitako/KGSt: Praxisleitfaden für generative KI

[12.09.2024] Einen Leitfaden für den Einsatz von generativer KI in Kommunalverwaltungen haben KGSt und Vitako erarbeitet. Der Fokus liegt auf der Integration von LLM-Tools in den Verwaltungsalltag. mehr...

Dr. Michael Neubauer
interview

Interview: KI-Entwicklung mitgestalten

[04.09.2024] Im Interview erklärt Michael Neubauer, Gründer des Start-ups Gov-KI, welche Potenziale er im Einsatz Künstlicher Intelligenz sieht und warum die öffentlichen Rechenzentren sich die Chance nicht entgehen lassen sollten, bei der KI-Entwicklung mitzuwirken. mehr...

München: Bearbeitungsstatus per QR-Code abfragen

[30.08.2024] Schnell, sicher und bequem können die Bürgerinnen und Bürger in München über einen personalisierten QR-Code den Bearbeitungsstatus beantragter Ausweisdokumente online abfragen. mehr...

Der Public Sector braucht eine souveräne Cloudlösung.

Digitale Souveränität: Die Kontrolle behalten

[29.08.2024] Die Wahl des richtigen Cloudanbieters ist entscheidend, um die digitale Souveränität zu erhöhen. Darüber hinaus minimieren ein Multicloudansatz und Open Source Software die Abhängigkeit von einzelnen Anbietern. mehr...

Stadt Konstanz plant Einführung einer Low-Code-Plattform.

Konstanz: Low-Code-Plattform für die Verwaltung

[29.08.2024] Die Konstanzer Stadtverwaltung plant die Einführung einer Low-Code-Plattform, um digitale Anwendungen künftig mit geringem manuellen Programmieraufwand erstellen zu können. Ein Pilotvorhaben war zuvor erfolgreich verlaufen. mehr...

Kamerafahrzeuge wie dieses fahren durch das Stadtgebiet

Dortmund: Daten für den Digitalen Zwilling

[28.08.2024] Mit Kameras und Laserscannern wird derzeit der gesamte Straßenraum Dortmunds erfasst. Die hochauflösenden, georeferenzierten 3D-Panoramabilder bilden zusammen mit bereits erstellten Luftbildern die Datengrundlage für den Digitalen Zwilling der Stadt. mehr...

Gemeindeverwaltung Döhlau arbeitet erfolgreich in der Cloud.

Döhlau: IT-Sorgen los

[26.08.2024] In Döhlau wurde die komplette IT-Infrastruktur vor rund drei Jahren in die Cloudlösung der AKDB-Tochter LivingData ausgelagert. Sorgen über veraltete Hardware, Sicherheits­lücken und Ausfälle gehören in der oberfränkischen Gemeinde seitdem der Vergangenheit an. mehr...