TNT logo LUH TNT
Bachelorarbeit, Masterarbeit, Studienarbeit, Diplomarbeit:

Coding and processing of high-throughput sequencing data

Im Rahmen des Projekts DNA

Beschreibung

Der Forschungsbereich der Genomik und insbesondere der DNA-Sequenzierung hat in den letzten Jahren große Fortschritte gemacht. Aufgrund der immer noch hohen Fehlerraten aktueller Sequenzierungstechnologien wird die in der DNA gespeicherte Information allerdings mehrfach redundant ausgelesen. Kombiniert mit verschiedenen Arten an Metainformationen entstehen bei der DNA-Sequenzierung und den nachfolgenden Verarbeitungsschritten sehr große Datenmengen. Für die nächsten Jahre wird geschätzt, dass der jährlich hinzukommende Speicherbedarf im Bereich der Genomik 2–40 Exabyte beträgt. Zum Vergleich: Für YouTube wird der jährlich zusätzlich benötigte Speicherplatz auf nur 1–2 Exabyte geschätzt. Um die breite Anwendbarkeit der DNA-Sequenzierung – zum Beispiel in der personalisierten Medizin – zu gewährleisten, forscht das TNT daher an Kompressions- und Verarbeitungsverfahren für sequenziertes DNA-Material. Im Rahmen dieser Arbeiten suchen wir Verstärkung im Kontext einer Abschlussarbeit.

Voraussetzungen

In dieser Abschlussarbeit entwickelst und testest Du Algorithmen für die Verarbeitung, Codierung, Speicherung und Übertragung von sequenziertem DNA-Material. Hierbei erhältst Du die Gelegenheit, auf dem aktuellen Stand der Technik zu forschen. Bei entsprechend guten Forschungsleistungen bieten wir Dir die Gelegenheit, Deine Ergebnisse als Paper zu veröffentlichen. Wir erwarten gute bis sehr gute Programmierkenntnisse in C/C++, Spaß am Programmieren, sowie Kreativität, um neue Verfahren zu entwickeln. Empfohlen sind Kenntnisse in den Bereichen Informationstheorie, Signalverarbeitung und Quellencodierung.

Ansprechpartner: Jan Voges