Donnerstag, 10. Oktober 2024

Generative KITrainingsdaten in Form bringen

[28.08.2023] Guter Input ergibt guten Output – diese einfache Regel gilt auch für die Daten, mit denen KI-Anwendungen trainiert werden. Je besser Daten aufbereitet sind, desto effizienter ist die Entwicklung und desto sicherer die spätere KI-Lösung.
Guter Input ergibt guten Output – diese einfache Regel gilt auch für die Daten

Guter Input ergibt guten Output – diese einfache Regel gilt auch für die Daten, mit denen KI-Anwendungen trainiert werden.

(Bildquelle: 123rf.com/peshkova)

Anwendungen, die Daten mithilfe Künstlicher Intelligenz (KI) oder maschinellem Lernen (ML) verarbeiten, werden derzeit breit diskutiert. Die Debatte konzentriert sich dabei vor allem auf ethische und sicherheitsrelevante Aspekte und damit auf Fragen des richtigen Einsatzes von (generativer) KI. Die Frage nach der Qualität solcher Anwendungen, die wiederum von den Daten abhängt, mit denen die Algorithmen trainiert werden, wird in der öffentlichen Diskussion vernachlässigt. Zu diesem Schluss kommt das Schweizer Data-Intelligence-Unternehmen Aparavi. Aparavi schätzt, dass bis zu 80 Prozent der Daten, die für das KI-Training infrage kommen, unstrukturiert sind. In diesen Beständen verbergen sich nicht nur veraltete Dokumente oder risikobehaftete Daten, sondern auch wichtige und wertvolle Informationen. Solche Datenbestände müssten schon vorab klassifiziert und bereinigt werden.

Sensible Daten aussieben

Eine saubere Data Collection ist für eine sinnvolle, effektive Entwicklung von KI-Apps essenziell. Denn die Qualität des Outputs bei der KI-Entwicklung hängt zwangsläufig von der Qualität des Inputs ab – je gepflegter die Trainingsdaten, desto höher der Anwendungsnutzen. Ideal sind „transparente, klassifizierte, strukturierte und priorisierte Daten und Metadaten“, so Aparavi, die auch von Dubletten bereinigt sein sollten. Ebenso wichtig sei es, kritische sensible Daten und Dokumente, die aus rechtlichen Gründen nicht verwendet werden dürften, auszusieben. Dazu gehören beispielsweise personenbezogene Daten oder Inhalte, die vor dem Stichtag einer Änderung rechtlich relevanter Vorgaben datieren. Um Verfälschungen, aber auch Risiken und Strafzahlungen zu vermeiden, müssten diese identifiziert und aus Datenbeständen entfernt werden, noch bevor die Datenbestände für das Training generativer KI-Anwendungen herangezogen werden.

Entwicklungszeiten abkürzen

Die Nutzung künstlich erzeugter Datensätze, so genannter synthetischer Daten, nimmt zu. Die Fachleute von Aparavi sehen dies als Indikator der Unzufriedenheit von Data Scientists mit dem vorhandenen echten Datenmaterial. Dennoch seien synthetische Daten kein vollwertiger Ersatz für das Training von KI-Anwendungen: Mit Originaldaten könnten Algorithmen und Anwendungen deutlich schneller und effizienter entwickelt werden als mit simulierten Datensätzen.
KI-Entwicklung ist per se ein iterativer Prozess mit hohem Ressourcenbedarf – und verursacht folglich hohe Kosten. Ein schlechter Dateninput verlängert die Entwicklungszeiten und erhöht die Kosten zusätzlich. Ein sauberer, auf relevante, sinnvolle Daten kondensierter Datenbestand kann die Anwendungsentwicklung hingegen beschleunigen und damit auch den finanziellen Aufwand reduzieren. „Clean and Lean Data spielen bei der Entwicklung von KI- und ML-Apps eine überragende Rolle“, sagt der Aparavi-CEO Adrian Knapp. Ob eine KI-Anwendung erfolgreich wird, entscheide sich an den Daten, die sozusagen das Futter für die zu trainierenden Algorithmen darstellen.





Weitere Meldungen und Beiträge aus dem Bereich: Panorama
Cover eGovernment Monitor 2024

eGovernment Monitor 2024: Digital Vertrauen gewinnen

[08.10.2024] Digitale Angebote der Verwaltung, die leicht auffindbar, verständlich und schnell nutzbar sind, können das Vertrauen der Bürgerinnen und Bürger in den Staat stärken. Zwischen Wunsch und Wirklichkeit klafft laut dem diesjährigen eGovernment Monitor der Initiative D21 allerdings noch eine deutliche Lücke. mehr...

BMEL: Förderung von Interoperabilität

[08.10.2024] Das Bundesministerium für Ernährung und Landwirtschaft (BMEL) fördert modellhafte Projekte, welche die Interoperabilität digitaler Systeme in ländlichen Räumen verbessern. Ziel ist eine bessere Daseinsvorsorge durch effiziente Planung und Kommunikation. mehr...

Streng geometrische Hausfassade mit klassizistischen Elementen, ganz in grau, nur die Haustür ist Orange. Davor parken zwei Fahrräder.

Berlin: Digitaler Antrag für den WBS

[07.10.2024] In Berlin können Wohnberechtigungsscheine (WBS) und Einkommensbescheinigungen ab sofort digital beantragt werden. Mit dem neuen Onlineantrag wird der Prozess vereinfacht und beschleunigt – auch für die Bürgerämter. Allein im vergangenen Jahr wurden dort über 70.000 WBS-Anträge manuell bearbeitet. mehr...

Foto: Bäcker

Heidelberg: Digitaler Ferienpass kam gut an

[04.10.2024] Der digitale Ferienpass der Stadt Heidelberg ist bei Eltern gut angekommen. Für den neuen Onlineservice erhielt das Heidelberger Ferienpass-Team zahlreiche positive Rückmeldungen. mehr...

In eigener Sache: Kommune21-Website in neuem Glanz

[02.10.2024] Die Website von Kommune21 wurde neu gestaltet. Das neue, aufgeräumte Design sorgt für eine bessere Benutzerfreundlichkeit. Die bewährte Struktur als Themenportal bleibt erhalten. mehr...

Cover der Studie des es Fraunhofer-Instituts IAO zu atenmanagement in Kommunen.

White Paper: Mehr Datenkompetenz für Kommunen

[01.10.2024] Die Menge an Daten wächst – auch in Kommunalverwaltungen. Das Management und der strategische Umgang damit bleiben herausfordernd, insbesondere für kleinere Kommunen. Ein White Paper des Fraunhofer-Instituts IAO zeigt nun ein praxisnahes Vorgehensmodell, mit dem Kommunen ihr Datenmanagement verbessern können. mehr...

KGSt: 75-jähriges Jubiläum gefeiert

[30.09.2024] Die KGSt hat jetzt ihr 75-jähriges Jubiläum mit über 300 Gästen in Köln gefeiert. Im Zentrum der Veranstaltung standen die Bedeutung der kommunalen Zusammenarbeit sowie der Blick auf die Zukunft der Kommunalverwaltung. mehr...

Herford: Digitale Verwaltungsservices für Unternehmen

[30.09.2024] In Zusammenarbeit mit OWL-IT fokussiert sich die Stadt Herford mit zwei Teilprojekten auf die Verbesserung der digitalen Verwaltungsangebote. Ziel ist es, Unternehmen den Zugang zu städtischen Dienstleistungen zu erleichtern. mehr...

Live-Webinar „Kommune21 im Gespräch“: Modernisierung der Register

[26.09.2024] Die Webinarreihe „Kommune21 im Gespräch“ widmet sich am 24. Oktober dem Thema Registermodernisierung und digitale Identitäten. Diskutiert wird, welche Herausforderungen und Chancen dieser digitale Wandel für die Kommunen mit sich bringt und wie sich Städte und Gemeinden darauf vorbereiten können. mehr...

Das Panel des Vitako-Herbstempfangs im Haus der Bundespressekonferenz.

Vitako: Positionspapier zum AI Act

[13.09.2024] Über das Potenzial von Künstlicher Intelligenz in der Verwaltung diskutierten Vertreter aus Politik und Verwaltung auf dem Vitako Herbstempfang. Darüber hinaus stellte Vitako sein Positionspapier zur nationalen Implementierung des AI Acts vor. mehr...

In Kommunen gibt es vielfältige Projekte

Wettbewerb: Digitale Angebote für Ältere gesucht

[11.09.2024] DigitalPakt Alter unterstützt Ältere darin, eigene digitale Kompetenzen auf- und auszubauen und hilft bürgerschaftlich Engagierten, ihr Digitalwissen weiterzugeben. Nun sucht die Initiative in einem Wettbewerb die zehn besten kommunalen Projekte zum Thema digitale Teilhabe für Ältere. mehr...

Durch den Austausch mit anderen Kommunen im Netzwerk PICTURE improve können bei der Prozessmodellierung erhebliche Zeiteinsparungen realisiert werden.

Diez: Systematisches Prozessmanagement

[10.09.2024] Den vielfältigen Herausforderungen der Verwaltungsmodernisierung begegnet die Verbandsgemeinde Diez mit einem systematischen Prozessmanagement. Dabei setzt die Kommune auf den verwaltungsübergreifenden Austausch im Prozessnetzwerk PICTURE improve. mehr...

Münster: KI für flotteren Busverkehr

[30.08.2024] Die Stadt Münster und RWTH Aachen starten in Münster ein Pilotprojekt an einem wichtigen Zubringer zur Innenstadt. Kameras und eine smarte KI an Ampelanlagen können die Grünphase für sich nähernde Linienbusse verlängern, reagieren aber auch auf andere Verkehrsteilnehmer. mehr...

ZenDiS: SaaS-Angebot für openDesk

[30.08.2024] Die open-source-basierte Office-Suite für die öffentliche Verwaltung, openDesk, ist bisher nur für den Eigenbetrieb ohne Service und Support zu haben. Das ändert sich nun: Das ZenDiS hat dem IT-Dienstleister B1 Systems den Zuschlag für eine Enterprise Edition erteilt, dazu gehört auch ein SaaS-Angebot. mehr...

Laut einer Umfrage sind 68 Prozent der Befragten mit der Hamburgischen Verwaltung zufrieden oder sehr zufrieden.

Hamburg: Positives Feedback

[26.08.2024] In einer digitalen Befragung hat sich die Freie und Hansestadt Hamburg von ihren Bürgern bewerten lassen. 68 Prozent der Befragten sind demnach zufrieden oder sehr zufrieden mit der Verwaltung. Die erste Kontaktaufnahme erfolgt vorzugsweise online, neue Online-Services werden bekannter. mehr...