Rita Korányi -
Ehemalige Applied Information and Data Science Studentin HSLU
Einleitung & Hintergrund
Kannst du uns zunächst ein wenig über deinen Hintergrund erzählen?
Nach neun Jahren bei einem Softwarekonzern habe ich mich für eine neue Herausforderung entschieden. So begann ich mein Studium "Master of Science in Applied Information and Data Science" bei der HSLU im Februar 2020. Nach vielen Unterrichtsstunden daheim habe ich meine Masterarbeit zusammen mit der Firma Beekeeper gestartet. Sie haben die Daten für meine Arbeit zur Verfügung gestellt. Ich wollte unbedingt etwas mit Graphdatenbanken und Graph Machine Learning machen.
Das Projekt
Nun zu deinem Projekt: Erzähl uns davon
Der Titel meiner Masterarbeit ist: Machine Learning on Graphs: Link Prediction in Social Networks.
In dieser Studie wurde die Untersuchung von Nutzerinteraktionsdaten in einer Graphdatenbank mit Algorithmen des maschinellen Lernens für die Extraktion und Vorhersage von Netzwerkmustern unter den Nutzern verglichen.
Das Projekt wurde zusammen mit Beekeeper realisiert. Beekeeper ist ein soziales Unternehmens-Netzwerk, welches den Unternehmen dabei hilft, Kommunikationslücken zu schliessen und die Zusammenarbeit zwischen den Mitarbeitenden und dem Management zu verbessern . Beekeeper ist nicht nur ein Werkzeug für die Kommunikation, sondern auch für das Optimieren von Unternehmensabläufen wie Schichten, interne Dokumente und allgemeines internes Kommunikationsmanagement zuständig. Das Unternehmen ist mitunter ein Pionier auf dem Gebiet der sozialen Unternehmens-Netzwerke als Dienstleistung und hat wichtige Schlüsselunternehmen in seinem Portfolio. Mir wurde von Beekeeper einen anonymisierten Datensatz zur Verfügung gestellt, mit welchem wir mehr darüber erfahren wollten, ob diese Daten in Form von Graphen für maschinelles Lernen verwendet werden können.
Mein Forschungsschwerpunkt lag darauf, die Kommunikationsabläufe und den Betrieb für einen der grössten und wichtigsten Kunden in der Transportbranche zu verbessern. Konkret ging es darum herauszufinden, wie genau maschinelles Lernen bei der Extraktion und Vorhersage von Mitarbeiterbeziehungen ist. Durch das Anonymisieren der Daten gingen zwar viele Informationen verloren, jedoch ist und bleibt der Schutz persönlicher Daten ein sehr wichtiger Aspekt der Datenverwaltung.
Die Menge an verfügbaren Informationen in der digitalen Welt enthält riesige Datenmengen, weit mehr als Menschen konsumieren können. Die Beekeeper AG bietet eine GDPR (General Data Protection Regulation / DSGVO Allgemeine Datenschutz-Grundverordnung) - konforme Plattform für Mitarbeiter. Die Mitarbeiter haben normalerweise keinen permanenten Zugang zu digitalen Informationen.
Die Suche innerhalb dieser Plattform nach relevanten Informationen für die tägliche Arbeit der Mitarbeiter erfordert effiziente Filterprinzipien, um den Zeitaufwand für die Suche zu reduzieren und somit wertvolle Arbeitszeit zu sparen. In Anbetracht der GDPR ist es jedoch nicht immer möglich, die Identifizierung und den Inhalt der Nutzer zu beobachten. Daher wird eine Linkvorhersage in einer Graphenstruktur als Alternative zur Darstellung von Informationen auf der Grundlage von GDPR-Daten vorgeschlagen.
Ergebnisse & Erkenntnisse
Die Ergebnisse zeigten, dass die Genauigkeit der Modelle etwas hinter den Erwartungen zurückblieb. Das während des Prozesses entwickelte Know-How jedoch hat wertvolle technische und geschäftliche Erkenntnisse für die Beekeeper AG generieren können.
Welche Daten verwendest du, welche Methode(n) wendest du an und welche wichtigen Erkenntnisse gewinnst du daraus oder versprichst du dir?
Wie schon erwähnt habe ich ein anonymisiertes Datenset von Beekeeper erhalten. Wir wollten Erkenntnisse gewinnen, ob diese Daten als Graphen dargestellt, für Machine Learning benutzt werden können. Oder etwas detaillierter: Ob das Extrahieren und die Vorhersage von Mitarbeiterbeziehungen mit Machine Learning akkurat möglich ist.
Wie können deine Erkenntnisse unsere Gesellschaft weiterbringen?
Als die Resultate validiert worden sind, konnte man unter anderen eindeutig einen Overload oder Ablenkung bei der Arbeit durch viele Chat Anfragen eindeutig erkennen. Ich denke, solche Erkenntnisse können einer Firma bei den Themen Modern Work und Prozessoptimierungen bei einer Firma Mehrwert bringen - etwa bei den räumlichen Gestaltungen bis hin zum virtuellen Arbeiten. In diesem Gebiet könnte man modellieren, in welcher Struktur Mitarbeitende besser und effizienter untereinander kommunizieren können. Wichtig wäre an dieser Stelle also das Wie und nicht das Was. 😉
Artikel Publikation und Poster
Das Projekt hat mir sehr viel Spass gemacht. Das war auch ein sehr wichtiger Faktor für mich.
Ich hatte zuvor nie daran gedacht, dass ich eine Publikation schreibe und ich erinnere mich noch an meine Aufregung und den Abschlusssatz in dem Kick-off Call «Let’s do it!». Meine Betreuer (Jose Mancera und Prof. Dr. Michael Kaufmann) und ich haben uns im Anschluss dazu entschieden, meine Masterthesis beim MDPI Journal Knowledge (Multidisciplinary Digital Publishing Institute) einzureichen. MDPI ist ein Pionier im wissenschaftlichen Open Access Publishing. Dort ist meine Arbeit nun für alle frei zugänglich und freut sich über Leserinnen und Leser!
Neugierig geworden? Klicken Sie hier:
Vor lauter Motivation habe ich mich gleichzeitig mit einem Poster für die Applied Machine Learning Days 2022 (AMLD) angemeldet. Umso grösser war meine Freude gewesen, als ich erfuhr, dass mein Thema ausgewählt wurde. #hurra
--> Klick zum Download / Poster im Grossformat
Wie möchtest du dein Projekt in Zukunft weiterverfolgen?
Ich habe die Tage mit Jose Mancera darüber gesprochen, was aus meinem Projekt bei Beekeeper geworden ist. Meine Forschung war ein Pionierthema im Unternehmen. Ich hoffe, dass andere Studierende ihre Arbeit als Diplomarbeit oder Projektarbeit bei Beekeeper fortsetzen und meine Modelle verbessern, oder andere Perspektiven hinzufügen können. Ich glaube, dass Graph Machine Learning und Graphdatenbanken in der Industrie immer mehr Aufmerksamkeit bekommen werden, daher werde ich mich weiter auf dem Laufenden halten.
Wie hat dein Studium (MSc in Applied Information and Data Science) das Projekt beeinflusst?
Ganz einfach gesagt: Ohne das Studium gäbe es all das nicht. Die persönlichen Kontakte und die Publikation würden nicht existieren, wenn ich das Studium nicht gemacht hätte. Die Studiengangleitung, Prof. Dr. Andreas Brandenberg, hat mich auch bei der Applied Machine Learning Days Konferenz unterstützt- selbst nachdem ich meinen Abschluss schon in der Tasche hatte.
Welchen Ratschlag würdest du Personen geben, die ähnliche Projekte starten?
Ich finde Begeisterung für ein Thema das Wichtigste. Lernen kann man alles… 😊
Und nun zum Schluss: Welchen neuen hashtag strebst du 2023 an?
#eskommtgut
Wir bedanken uns bei Rita Korányi und ihren Betreuern für das Engagement und die Zeit, um mit uns dieses wundervolle Research Projekt Portrait zu teilen.
Applied Data Science Berufsbilder
Programm Information | Kontakt | Info-Events
Daten sind die Ressource des 21. Jahrhunderts.
Nehmen Sie an einer Live-Talk Informations-Veranstaltung teil:
Sie möchten mehr über den Studiengang MSc in Applied Information and Data Science erfahren? Besuchen Sie eine unserer Info-Veranstaltungen (online oder vor Ort) und erfahren Sie mehr Details in einem persönlichen Gespräch mit der Studiengangsleitung.
Kontaktieren Sie uns, wenn Sie Fragen zu unserem Studiengang haben oder eine individuelle Beratung wünschen:
Tel. :+41 41 228 42 53 / E-mail: master.ids@hslu.ch
Mehr Informationen finden Sie hier:
- Master Programm Info
- Berufsbilder und Studieninsights
- Generalistisches Ausbildungsprofil
- FAQ