Bachelorarbeit mit dem Titel: Angriffe auf Autorschaftsverifikationsmethoden
Darmstadt, DE, 64295
Fraunhofer-Gesellschaft
Die Fraunhofer-Gesellschaft mit Sitz in Deutschland ist eine der fĂŒhrenden Organisationen fĂŒr anwendungsorientierte Forschung. Im Innovationsprozess spielt sie eine zentrale Rolle â mit Forschungsschwerpunkten in zukunftsrelevanten...Das Fraunhofer-Institut fĂŒr Sichere Informationstechnologie SIT gehört zu den fĂŒhrenden Forschungs- und Entwicklungseinrichtungen fĂŒr Cyber-Sicherheit in Deutschland und Europa und ist Teil von ATHENE, dem nationalen Forschungszentrum fĂŒr angewandte Cybersicherheit. ATHENE ist eine Kooperation der Fraunhofer-Gesellschaft mit der TU Darmstadt, der Hochschule Darmstadt und der Goethe-UniversitĂ€t Frankfurt. Unser gemeinsames Ziel: die Welt von morgen sicherer zu machen.
Â
Â
Was Du bei uns tust
Die Autorschaftverifikation (AV) stellt eine zentrale Herausforderung im Bereich der Digitalen Textforensik dar. Sie wird in zahlreichen Anwendungsfeldern genutzt, wie beispielsweise in der Strafverfolgung zur BekĂ€mpfung von Hassrede im Netz oder im akademischen Bereich zur ĂberprĂŒfung von Plagiaten. Der Forschungszweig beschĂ€ftigt sich mit der zentralen Frage ob zwei oder mehr Texte von derselben Person verfasst wurden. Das Pendant zur AV stellt Authorship Obfuscation (AO) dar, welches eine Teildisziplin der Digitalen Textforensik darstellt. AO-Methoden zielen darauf ab stilistische Merkmale eines Textes so zu verĂ€ndern, dass es schwierig oder (im Idealfall) unmöglich wird, den ursprĂŒnglichen Autor zu identifizieren. Diese Methoden werden insbesondere genutzt, um die PrivatsphĂ€re eines Autors zu schĂŒtzen oder um eine Identifikation durch AV-Methoden zu erschweren.
Ziel dieser Arbeit ist es, die Robustheit existierender AV-Methoden hinsichtlich Angriffsmöglichkeiten seitens von AO-Methoden zu untersuchen. Letztere basieren sowohl auf (1) stilometrische als auch (2) Deep-Learning-basierte AnsĂ€tze. Zu (1) zĂ€hlen etwa Textmodifikationen wie Ersetzungen von Synonymen/Phrasen, Umstellungen von AufzĂ€hlungen oder auch das Umschreiben von Kontraktionen. Zu (2) zĂ€hlen hingegen Textmodifikationen wie Backtranslation (Vor- und RĂŒckwertsĂŒbersetzung mit mehreren Zwischensprachen) mittels Ăbersetzungsdienste oder auch Paraphrisierung von SĂ€tzen mittels Large Language Models (LLMs).
Im ersten Schritt sollen zunĂ€chst mehrere aktuelle AV- und AO-Methoden recherchiert und ggf. nachimplementiert werden. AnschlieĂend gilt es aus gegebenen DatensĂ€tzen neue, modifizierte DatensĂ€tze zu erstellen. Dazu sollen die Original-Texte anhand der recherchierten AO-Methoden entsprechend modifiziert werden. Aufbauend auf den konstruierten DatensĂ€tzen sollen anschlieĂend die recherchierten AV-Methoden evaluiert werden, wobei es zu analysieren gilt, wie stark die Erkennungsleistung in Bezug zu den Original-DatensĂ€tzen sinkt und womit das zusammenhĂ€ngt. Aufbauend auf den gewonnenen Erkenntnissen soll eine der recherchierten AV-Methoden ausgewĂ€hlt und auf diesen Anwendungsfall erweitert bzw. optimiert werden um die AO-Angriffe entgegenzuwirken. Dies kann z. B. mithilfe von stilistischen Merkmalen bewerkstelligt werden, welche von den betrachteten AO-Methoden nicht berĂŒcksichtigt werden.
Die Erkenntnisse dieser Arbeit sollen einen Beitrag zur Weiterentwicklung von AO-resistenten AV-AnsÀtzen beitragen.
Â
Was Du mitbringst
-
Studium der Informatik, Mathematik oder eines verwandten Fachgebiets mit Fokus auf Maschinelles Lernen und idealerweise Natural Language Processing (NLP)
-
Fundierte Kenntnisse in Machine/Deep Learning
-
Vertraut mit verschiedenen Architekturen von Neuronalen Netze (u.a. CNNs, Transformer, GNNs, xLSTM)
-
Vertraut mit grundlegenden Begriffen und Konzepte wie: Klassifikation, Hyperparameter-Optimierung, Fine-Tuning, Evaluierung von Modellen
-
-
Fundierte Kenntnisse in Python sind zwingend erforderlich
-
Von Vorteil: FÀhigkeit, Methoden und Verfahren aus wissenschaftlichen Veröffentlichungen eigenstÀndig umzusetzen
-
Von Vorteil: Wissen und Erfahrung im Bereich Cybersicherheit
-
Bereitschaft, sich neuen Herausforderungen zu stellen
-
AusgeprÀgtes analytisches Denken
Â
Was Du erwarten kannst
- SelbststÀndige Arbeitszeiteinteilung
- Einblicke in das Schnittfeld von akademischer Forschung und industrieller Anwendung
Â
Wir wertschĂ€tzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrĂŒĂen daher alle Bewerbungen â unabhĂ€ngig von Alter, Geschlecht, NationalitĂ€t, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und IdentitĂ€t. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt.
Â
Mit ihrer Fokussierung auf zukunftsrelevante SchlĂŒsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber fĂŒr innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft.Â
Haben wir Dein Interesse geweckt? Dann bewirb Dich jetzt online mit Deinen aussagekrĂ€ftigen Bewerbungsunterlagen. Wir freuen uns darauf, Dich kennenzulernen!Â
Â
Â
Fraunhofer-Institut fĂŒr Sichere Informationstechnologie SITÂ
Kennziffer:Â 78185Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Bewerbungsfrist:Â
Â
* Salary range is an estimate based on our AI, ML, Data Science Salary Index đ°
Tags: Computer Science Deep Learning LLMs Mathematics NLP Python
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.