Startseite
Künstliche Intelligenz
Daten und Datenverarbeitung als Fundament für den Einsatz von KI

Wissenspool-Beitrag

Daten und Datenverarbeitung als Fundament für den Einsatz von KI

21.09.2022

Lesezeit: ca. 14 min

Beschreibung der KI Technologie/Methode

Inwiefern sind Daten wertvoll?

Die weltweite Datenmenge nimmt seit Jahren exponentiell zu. Von dieser Fülle an Daten profitieren vor allem Unternehmen: Ihre Effizienz und Innovation schnellen in die Höhe – eine Entwicklung, die sich in absehbarer Zeit noch weiter verstärken wird.

„Daten sind das neue Öl“ ist ein populärer Ausschnitt eines Zitats, welches vermutlich vom britischen Mathematiker Clive Humby stammt.¹ Ähnlich wie Rohöl werden Rohdaten auch erst dann wirklich wertvoll, wenn sie raffiniert, beziehungsweise aufbereitet werden. Erst wenn sie eine für den Anwendungsfall nutzbare Form haben, können aus ihnen beispielsweise Handlungsempfehlungen abgeleitet werden.²

Folgende Aussage vom ehemaligen Vizepräsidenten des Marktforschungs- und Beratungsunternehmen Gartner, Peter Sondergaard, ist sehr treffend:

„Information ist das Öl des 21. Jahrhunderts und Datenanalytik seine Verbrennungsmaschine.“

Insbesondere beim Maschinellen Lernen (ML), welches einen wichtigen Teilbereich der KI darstellt, spricht man von selbstlernenden Algorithmen und einen datengetriebenen Ansatz. Gerade die Auswahl der richtigen Daten, in geeigneter Qualität und erforderlicher Quantität ist Grundvoraussetzung für die Trainingsphase eines KI-Systems und damit für das Gelingen eines KI-Projektes.

Machine Learning ist ein Teilbereich der künstlichen Intelligenz und nutzt Algorithmen und statistische Methoden, um Daten zu analysieren und Muster zu erkennen.

Warum ist eine gute Datenverarbeitung so wichtig?

Ähnlich wie die Unterlagen eines Schülers korrekt und vollständig sein müssen, damit er für eine Klassenarbeit erfolgreich lernen kann, müssen auch die Trainingsdaten für den Erfolg eines KI-Projekts qualitative und quantitative Anforderungen erfüllen. Konkret werden unter anderem folgende Anforderungen an die Daten gestellt³:

Vollständigkeit
Widerspruchsfreiheit
Konsistenz
Aktualität

Wenn jedoch die Qualität der Eingabedaten schon unzureichend ist, liefert die Ausgabe des KI-Modells höchstwahrscheinlich nicht die gewünschten Ergebnisse („Garbage in, garbage out“). Neben der Datenqualität ist auch die Datenmenge für den Erfolg eines KI-Projekts von zentraler Bedeutung. Im Allgemeinen steigt die Genauigkeit eines KI-Modells je mehr Daten in hinreichender Qualität zur Verfügung stehen.

Wie funktioniert die Datenaufbereitung in der Praxis?

In der Regel sind mehrere Arbeitsschritte notwendig, damit Rohdaten zur Entwicklung und Anwendung KI-basierter Technologien eingesetzt werden können. Am Beispiel der Nutzung von Kundendaten in einem Unternehmen des produzierenden Gewerbes zur Vorhersage des zukünftigen Kaufverhaltens eines Kunden kann dies verdeutlicht werden.

Datenerfassung: In einem ersten Schritt müssen sämtliche Kundendaten erfasst werden, die für den Anwendungsfall relevant sind. Wie in Abbildung 1 dargestellt, können dies bei einem Privatkunden zum Beispiel soziodemographische Daten wie seine Adresse, Telefonnummer und Geburtsdatum, Verhaltensdaten wie die Kaufhistorie und die genutzten Geräte sowie psychografische Daten wie die Bewertung vergangener Bestellungen sein.⁴ Herausfordernd wird die Datenerfassung dadurch, dass die benötigten Daten oft aus verschiedenen Subsystemen mit unterschiedlichen Datenformaten zusammengeführt werden müssen. Zudem liegen sie anfangs meist in unstrukturierter Form vor.

Abbildung 1: Arten von Kundendaten⁵

Datenbereinigung: Für den Erfolg der Anwendung sind auch die Vollständigkeit und Vergleichbarkeit der Daten von zentraler Bedeutung. Deshalb empfiehlt es sich zuerst, Einträge aus den Datensätzen zu entfernen, welche für den späteren Anwendungsfall irrelevant sind. Oftmals ist es auch notwendig, fehlende Daten zu ergänzen, da zum Beispiel zu einem bestimmten Kunden keine Anschrift hinterlegt ist. Zudem können fehlerhafte Einträge wie ungültige Postleitzahlen oder Datenduplikate (mehrfache Registrierung des Kunden) vorliegen, die korrigiert beziehungsweise entfernt werden müssen. Damit die Daten später verarbeitet werden können, müssen diese in einen einheitlichen Datentyp konvertiert werden. Abbildung 2 illustriert mögliche Fehler in den Daten, die bereinigt werden müssen. Abschließend ist eine Standardisierung der Daten erforderlich, damit sie vergleichbar sind und vom KI-Modell verarbeitet werden können. Beispielsweise können sie so transformiert werden, dass alle Datenausprägungen Werte zwischen null und eins annehmen.

Abbildung 2: Mögliche Fehlerarten

Datenexploration: Nach der Datenbereinigung erfolgt die explorative Datenanalyse. Um Unstimmigkeiten und Muster in den Daten zu erkennen, bietet sich eine Visualisierung der Daten an. Gängige Methoden sind die Erstellung von Histogrammen, Box-Plots oder Streuungsdiagrammen. Die Datenvisualisierung erleichtert zudem den Austausch mit Mitarbeitern aus IT-fernen Fachabteilungen. Im Zuge der Datenexploration ist es zum Beispiel möglich, das Kaufverhalten von Kunden ähnlichen Alters zu vergleichen oder Kunden mit ungewöhnlich hohen Bestellmengen (Ausreißer) zu detektieren.

Abbildung 3: Darstellung der Bestellwerte der Kunden in einer Region als Histogramm

Merkmalsextraktion: Abschließend werden aus den aufbereiteten Daten bestimmte Merkmale extrahiert, welche als Eingangsgröße für das KI-Modell verwendet werden können. Mögliche Merkmale können das Alter des Kunden, Bestellhäufigkeit, Bestellmenge, Bestellwert oder Surfverhalten sein. Diese können genutzt werden, um beispielsweise den nächsten Bestellzeitpunkt und die Bestellmenge eines Kunden vorherzusagen.

Mögliche Anwendungsbereiche

Die Einsatzmöglichkeiten für Daten bzw. intelligente Datenverarbeitung sind nahezu unbegrenzt und umfassen praktisch alle Branchen (insbesondere IT, Dienstleistungen, Finance, Retail) und auch alle Unternehmensbereiche, in denen entsprechende Daten, die zur Analyse geeignet sind, vorliegen, wie z.B. Logistik, Produktion, Supply Chain, Beschaffung/Einkauf, Personalwesen, Kundenmanagement, Marketing und Vertrieb, Qualitätskontrolle / Qualitätssicherung.⁶

Nutzen und Voraussetzungen für KMU

Der Nutzen für KMU liegt vor allem in der Automatisierung und entsprechenden Effizienzgewinnen. AutoML-Tools, die Aufgaben bei der Entwicklung und Bereitstellung von ML-Modellen automatisieren, stellen sowohl für Datenspezialisten als auch Datenanalysten einen entscheidenden Durchbruch dar, da Datennutzer mit diesen Tools Teile des ML-Workflows, z. B. Datenaufbereitung, Training und Auswahl des Modells und vieles mehr, automatisieren können. Einsparungen ergeben sich also nicht nur durch die Analyse, sondern auch dadurch, dass aufwändige Arbeiten (Laden, Auswählen, Aufbereiten und Bereinigen von Daten), die bisher bis zu 80 % der Arbeitszeit beanspruchten, nur noch etwa 45 % der Zeit benötigen, wie eine von Anaconda durchgeführte und von Datanami veröffentlichte Befragung unter Datenspezialisten ergab.⁷ Dies lässt mehr Zeit für die Analyse. Menschliche Fehler, die bei manuellen Modellierungsprozessen auftreten, werden ebenfalls reduziert, was die Genauigkeit erhöht.

Einsparungen können jedoch auch dadurch entstehen, dass wenig genutzte Firmendaten besser verwaltet werden. Studien der Analysten von IDC⁸ zeigen, dass ca. 60-90% aller Firmendaten – ein exorbitant hoher Prozentsatz – kalte Daten sind. Also Daten, die nicht oder nur selten genutzt werden. Diese Daten können mittels intelligenter Datenmanagement-Software identifiziert und geräuschlos auf günstige Speicher transferiert werden. So lassen sich Kosten für teure Speicher einsparen und gleichzeitig ein transparenter Überblick über den aktuellen Datenbestand erzeugen. Auch Analysen über Dateitypen, automatische Archivierungen und vieles mehr sind möglich.

Eine notwendige Voraussetzung für den Einsatz von Business Intelligence-Technologien ist die Sammlung von unstrukturierten Massendaten (Big Data) als Grundlage für darauf aufbauende, komplexe statistische Auswertungen (Business Analytics). Wie auch bei anderen KI-Technologien kommt hier der Qualität der Daten eine entscheidende Bedeutung zu. Im Hinblick auf das Personal müssen Controller sich aktiv mit Big Data auseinander setzen bzw. auseinander setzen können.

Weiterführende Informationen

Reifegrad: Auswahl aus weitegehend noch Teil von Forschungsprojekten, bereits erste marktreife Produkte vorhanden, wird als Standard in ausgewählten Einsatzbereichen eingesetzt und/oder es existieren vielfältige Anbieter für die Technologie
Beispiel-Anwendungen: Überblick & Verlinkung zu den Beispiel-Anwendungen (im KIWW-Wissenspool sowie extern)
Forscher:innen und Anbieter: Überblick & Verlinkung zu den Forscher:innen und Anbietern

Quellenverzeichnis

1. Arthur, C. (2013). Tech giants may be huge, but nothing matches big data.

2. Stal, M. (2017). Data is the new Oil [Clive Humby] JavaSpektrum, (1), 3.

3. Keim, D. und Sattler, K. W. (2020). Von Daten zu KI –Intelligentes Datenmanagement als Basis für Data Science und den Einsatz Lernender Systeme [Whitepaper]. Plattform Lernende Systeme.

4. https://www.crossengage.io/de/kundendaten-ein-ueberblick/

5. o. A. (2020). Kundendaten: ein Überblick.

6. Gadatsch, A. (2017): “Big Data – Datenanalyse als Eintrittskarte in die Zukunft”, in Big Data für Entscheider, pp. 1-10.

7. https://www.datanami.com/2021/07/27/anacondas-2021-state-of-data-science-report-highlights-support-for-open-source-impacts-from-covid-19/

8. https://www.idc.com/search/simple/perform_.do?sortBy=DATE&query=&srchIn=ALLRESEARCH&src=&athrT=10&hitsPerPage=25&lang=English&cmpT=10&top=4_545

Autor

Manuel A. Heid

Dieser Beitrag wurde von Manuel A. Heid verfasst. Er ist Researcher am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) und hat sich im Projekt Mittelstand-Digitalzentrum mit der Einführung KI-basierter Lösungen in Unternehmen beschäftigt sowie KMU auf dem Weg zum Einsatz dieser Lösungen im Bereich der optischen Qualitätskontrolle unterstützt.

Wissenspool-Beitrag

Künstliche Intelligenz

Wie bringen wir KI menschzentriert auf den betrieblichen Hallenboden?

6 Zukunftsthesen Dieser Text entstand im Rahmen des 3. Vernetzungstreffens der Zukunftszentren am 15.05.2024 in Darmstadt. Unter dem Titel: „Wie bringen wir KI auf den betrieblichen Hallenboden?“ wurden dort im Rahmen eines World Cafés Thesen zu Aspekten der beraterischen Praxis in den Zukunftszentren aufgestellt und diskutiert. Mit welchen praktischen Herausforderungen sind die Beraterinnen der Zukunftszentren […]

Wissenspool-Beitrag

Künstliche Intelligenz

Künstliche Intelligenz im Mittelstand – Die KI-Studie von Mittelstand-Digital

Seit 2017 hat sich die Anzahl von Unternehmen, die KI nutzen verdoppelt – auch kleine und mittlere Unternehmen stellen sich daher vermehrt die Frage, ob und wie künstliche Intelligenz im Arbeitskontext nutzbar ist. Im Dezember 2023 veröffentlichte Mittelstand-Digital im Auftrag des Bundesministeriums für Wirtschaft und Klimaschutz hierzu die Erhebung ihrer Begleitforschung unter dem Titel „Künstliche […]

Wissenspool-Beitrag

Künstliche Intelligenz

KI-Tools für die Erstellung von Dokumenten: Entlastung oder zusätzliche Ausgabe?

Gut aufgearbeitete und visuell ansprechende Präsentationen und Dokumente sind unverzichtbare Werkzeuge für Kommunikation und Zusammenarbeit in der digitalen Arbeitswelt. Doch während die Nachfrage nach hochwertigen Inhalten steigt, wächst auch der Bedarf an effizienteren Methoden zu ihrer Erstellung. Bisher war die Erstellung von Dokumenten und Präsentationen ein zeitaufwändiger Prozess, der oft manuelle Eingaben, Formatierungen und Recherchen […]

Wissenspool-Beitrag

Künstliche Intelligenz

Stärkere Reglementierung von Künstlicher Intelligenz in der Europäischen Union

Die erste Hürde für das erste KI-Gesetz der Welt ist genommen. Am 13.03.2024 stimmte das Europäische Parlament in Straßburg mehrheitlich für den, schon bereits 2021 von der EU-Kommission vorgelegten, Gesetzentwurf zur Regulierung des Einsatzes von KI. Nun fehlt nur noch die Zustimmung des Europäischen Rats und die KI-Verordnung würde bereits 20 Tage nach der Veröffentlichung […]

Wissenspool-Beitrag

Künstliche Intelligenz

Maschinelles Lernen leicht gemacht: Grundlagen und Anwendungen für Ihr mittelständisches Unternehmen

Künstliche Intelligenz (KI) mag auf den ersten Blick kompliziert erscheinen, tatsächlich verbirgt sich dahinter aber eine Welt voller Möglichkeiten, insbesondere in den Bereichen Machine Learning und Deep Learning. Lassen Sie uns diese Konzepte gemeinsam beleuchten und verstehen:

Wissenspool-Beitrag

Qualifizierung und Fachkräfte, Künstliche Intelligenz

Fachkräfte gewinnen mit Daten und Künstlicher Intelligenz

Der Fach- und Arbeitskräftemangel wird zu einer immer größeren Herausforderung in vielen Branchen. Besonders in der deutschen Sozial- und Gesundheitswirtschaft fehlen bereits heute zahlreiche Fachkräfte und es ist zu erwarten, dass sich dieser Trend zukünftig weiter fortsetzt. Gleichzeitig steigt die Zahl der pflege- und hilfsbedürftigen Menschen, was die Versorgungslücke in der Sozialwirtschaft vergrößert. Um dem […]

Wissenspool-Beitrag

Künstliche Intelligenz, Soziale Verantwortung

KI in der Pflege – Gefahr von Diskriminierung

Die Technologien, die landläufig unter den Begriff „Künstliche Intelligenz“ gefasst werden, dringen in immer mehr Bereiche unserer Arbeit vor – wir haben hier im Blog zum Beispiel bereits auf Einsatzmöglichkeiten im Personalbereich hingewiesen. Gerade bei diesem Thema besteht jedoch die Gefahr, dass der Einsatz von KI Diskriminierungen reproduziert und innovative Ansätze blockiert. Hier geht’s zum […]

Wissenspool-Beitrag

Künstliche Intelligenz

Das neue KI-Gesetz der Europäischen Union: Leitlinien als ein Werkzeug der Umsetzung im Unternehmen

Leitlinien für eine KI-Rahmenvereinbarung Die Implementierung von KI in Unternehmen muss den neuen Bestimmungen des …

Wissenspool-Beitrag

Qualifizierung und Fachkräfte, Künstliche Intelligenz

Enorme Veränderungen durch KI: Beschäftigte müssen geschult werden

Künstliche Intelligenz (KI) verändert unser Leben. Ob in der Medizin, beim Online-Shopping, im Straßenverkehr oder beim Schreiben von Texten: Das Potenzial von KI ist enorm. Überall dort, wo viele Daten verfügbar sind, verändert KI die Art und Weise, wie Menschen Aufgaben erledigen können. In einer Umfrage unter deutschen Erwachsenen im Alter bis zu 75 Jahren gibt ein Drittel der Personen […]

Wissenspool-Beitrag

Künstliche Intelligenz, Qualifizierung und Fachkräfte

„KI kann Personalteams darin unterstützen, das Potenzial von Menschen zu entdecken“

ANNA KAISER Unternehmerin und Mitglied im Rat der Arbeitswelt Anna Kaiser ist Gründerin und ehemalige CEO des Tech-Start-ups Tandemploy. Heute fungiert sie als Angel Investorin sowie Vice President EMEA, Innovation & Strategy beim globalen Tech-Unternehmen Phenom. Sie ist Mitglied verschiedener Gremien, darunter der Beirat Junge Digitale Wirtschaft des Bundesministeriums für Wirtschaft und Klimaschutz sowie der […]

Wissenspool-Beitrag

Künstliche Intelligenz, Qualifizierung und Fachkräfte

KI in produzierenden Unternehmen: Nutzen für Unternehmen und Beschäftigte

Künstliche Intelligenz (KI) gilt als eine der wichtigen Zukunftstechnologien. Deshalb befassen sich viele Studien mit ihrem Einfluss auf die Arbeitswelt. Im Zentrum steht häufig die Frage, wie KI “human friendly” eingesetzt werden kann – also so, dass keine Arbeitsplätze abgebaut werden oder sich die Arbeit zusätzlich intensiviert. Das ifaa – Institut für angewandte Arbeitswissenschaft e.V. untersuchte in einer Online-Befragung […]

Wissenspool-Beitrag

Qualifizierung und Fachkräfte, Künstliche Intelligenz

Einstieg in KI für Reiseunternehmen – unsere Ideenwerkstatt

Das 25-köpfige Team der HORiZONTE GmbH in Münster bietet Ferienfreizeiten, Gruppenreisen und Klassenfahrten inkl. Beförderung und Reiseleitung in Gruppenhäuser und Zeltcamps verschiedener Reiseziele in Europa an. Das Reisekonzept beinhaltet Rundum-Pakete inklusive Busbeförderung und landeskundige Servicereiseleitung vor Ort. Individuelle Wünsche von Klassenlehrern, Vereinsmitarbeitenden oder Jugendfreizeitorganisatoren werden bei der Reiseplanung gerne berücksichtigt. Seit 1982 steht die HORiZONTE GmbH für einen […]

Alle Wissenspool Beiträge