Bachelorarbeit mit dem Titel: Angriffe auf Autorschaftsverifikationsmethoden

Darmstadt, DE, 64295

Applications have closed

Fraunhofer-Gesellschaft

Die Fraunhofer-Gesellschaft mit Sitz in Deutschland ist eine der fĂŒhrenden Organisationen fĂŒr anwendungsorientierte Forschung. Im Innovationsprozess spielt sie eine zentrale Rolle – mit Forschungsschwerpunkten in zukunftsrelevanten...

View all jobs at Fraunhofer-Gesellschaft

Das Fraunhofer-Institut fĂŒr Sichere Informationstechnologie SIT gehört zu den fĂŒhrenden Forschungs- und Entwicklungseinrichtungen fĂŒr Cyber-Sicherheit in Deutschland und Europa und ist Teil von ATHENE, dem nationalen Forschungszentrum fĂŒr angewandte Cybersicherheit. ATHENE ist eine Kooperation der Fraunhofer-Gesellschaft mit der TU Darmstadt, der Hochschule Darmstadt und der Goethe-UniversitĂ€t Frankfurt. Unser gemeinsames Ziel: die Welt von morgen sicherer zu machen.

 

 

Was Du bei uns tust

Die Autorschaftverifikation (AV) stellt eine zentrale Herausforderung im Bereich der Digitalen Textforensik dar. Sie wird in zahlreichen Anwendungsfeldern genutzt, wie beispielsweise in der Strafverfolgung zur BekĂ€mpfung von Hassrede im Netz oder im akademischen Bereich zur ÜberprĂŒfung von Plagiaten. Der Forschungszweig beschĂ€ftigt sich mit der zentralen Frage ob zwei oder mehr Texte von derselben Person verfasst wurden. Das Pendant zur AV stellt Authorship Obfuscation (AO) dar, welches eine Teildisziplin der Digitalen Textforensik darstellt. AO-Methoden zielen darauf ab stilistische Merkmale eines Textes so zu verĂ€ndern, dass es schwierig oder (im Idealfall) unmöglich wird, den ursprĂŒnglichen Autor zu identifizieren. Diese Methoden werden insbesondere genutzt, um die PrivatsphĂ€re eines Autors zu schĂŒtzen oder um eine Identifikation durch AV-Methoden zu erschweren.


Ziel dieser Arbeit ist es, die Robustheit existierender AV-Methoden hinsichtlich Angriffsmöglichkeiten seitens von AO-Methoden zu untersuchen. Letztere basieren sowohl auf (1) stilometrische als auch (2) Deep-Learning-basierte AnsĂ€tze. Zu (1) zĂ€hlen etwa Textmodifikationen wie Ersetzungen von Synonymen/Phrasen, Umstellungen von AufzĂ€hlungen oder auch das Umschreiben von Kontraktionen. Zu (2) zĂ€hlen hingegen Textmodifikationen wie Backtranslation (Vor- und RĂŒckwertsĂŒbersetzung mit mehreren Zwischensprachen) mittels Übersetzungsdienste oder auch Paraphrisierung von SĂ€tzen mittels Large Language Models (LLMs).

Im ersten Schritt sollen zunĂ€chst mehrere aktuelle AV- und AO-Methoden recherchiert und ggf. nachimplementiert werden. Anschließend gilt es aus gegebenen DatensĂ€tzen neue, modifizierte DatensĂ€tze zu erstellen. Dazu sollen die Original-Texte anhand der recherchierten AO-Methoden entsprechend modifiziert werden. Aufbauend auf den konstruierten DatensĂ€tzen sollen anschließend die recherchierten AV-Methoden evaluiert werden, wobei es zu analysieren gilt, wie stark die Erkennungsleistung in Bezug zu den Original-DatensĂ€tzen sinkt und womit das zusammenhĂ€ngt. Aufbauend auf den gewonnenen Erkenntnissen soll eine der recherchierten AV-Methoden ausgewĂ€hlt und auf diesen Anwendungsfall erweitert bzw. optimiert werden um die AO-Angriffe entgegenzuwirken. Dies kann z. B. mithilfe von stilistischen Merkmalen bewerkstelligt werden, welche von den betrachteten AO-Methoden nicht berĂŒcksichtigt werden.


Die Erkenntnisse dieser Arbeit sollen einen Beitrag zur Weiterentwicklung von AO-resistenten AV-AnsÀtzen beitragen.

 

Was Du mitbringst

  • Studium der Informatik, Mathematik oder eines verwandten Fachgebiets mit Fokus auf Maschinelles Lernen und idealerweise Natural Language Processing (NLP)

  • Fundierte Kenntnisse in Machine/Deep Learning

    • Vertraut mit verschiedenen Architekturen von Neuronalen Netze (u.a. CNNs, Transformer, GNNs, xLSTM)

    • Vertraut mit grundlegenden Begriffen und Konzepte wie: Klassifikation, Hyperparameter-Optimierung, Fine-Tuning, Evaluierung von Modellen

  • Fundierte Kenntnisse in Python sind zwingend erforderlich

  • Von Vorteil: FĂ€higkeit, Methoden und Verfahren aus wissenschaftlichen Veröffentlichungen eigenstĂ€ndig umzusetzen

  • Von Vorteil: Wissen und Erfahrung im Bereich Cybersicherheit

  • Bereitschaft, sich neuen Herausforderungen zu stellen

  • AusgeprĂ€gtes analytisches Denken

 

Was Du erwarten kannst

  • SelbststĂ€ndige Arbeitszeiteinteilung
  • Einblicke in das Schnittfeld von akademischer Forschung und industrieller Anwendung

 

Wir wertschĂ€tzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrĂŒĂŸen daher alle Bewerbungen – unabhĂ€ngig von Alter, Geschlecht, NationalitĂ€t, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und IdentitĂ€t. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt.

 

Mit ihrer Fokussierung auf zukunftsrelevante SchlĂŒsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber fĂŒr innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft. 

Haben wir Dein Interesse geweckt? Dann bewirb Dich jetzt online mit Deinen aussagekrÀftigen Bewerbungsunterlagen. Wir freuen uns darauf, Dich kennenzulernen! 

 

 

Fraunhofer-Institut fĂŒr Sichere Informationstechnologie SIT 

www.sit.fraunhofer.de 


Kennziffer: 78185                Bewerbungsfrist: 

 

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Job stats:  1  0  0

Tags: Computer Science Deep Learning LLMs Mathematics NLP Python

Region: Europe
Country: Germany

More jobs like this