Module: Theorie Bioinformatica 3

Deze module draait vanaf schooljaar 2019-2020

Gegevensveld	Waarde
Osiriscode	OSIRISCODE
ECTS	3
Toetsvorm	Schriftelijk tentamen
Minimum cijfer	5,5
Docent(en)	HEMI
Contactpersoon	HEMI
Voertaal	Nederlands

Cursusdoelen (leerdoelen)

Netwerk-gebaseerde algoritmen kennen en begrijpen (zoals toegepast in assembly, hidden markov models, gene network reconstruction)
De tegenwoordige "beste" algoritmen voor fylogenie kennen en de daardoor geproduceerde stambomen op accuratesse kunnen beoordelen
Annotatiesoftware en databases kennen en kunnen toepassen op nieuw te annoteren sequentiedata
Begrijpen waarom de door HMMer geproduceerde Hidden Markov Models lijken op de models die door Machine Learning geproduceerd worden als "representatie" van een te annoteren biologisch concept

Inhoud

Dit vak begint met een tweede blik op fylogenie, en dan specifiek hoe fylogenie gebruikt kan worden bij epidimiologische vragen en in de menselijke genetica (stambomen). Onder andere error-correctie en parsimony-based methoden worden besproken om de huidige, state-of-the art van fylogenie helder te krijgen. Dit vak behandelt ook geavanceerde methoden om annotatie van NGS data en algemener biologische functionaliteit herkennen in grote hoeveelheden data. Het eerste, snelle algoritme is gebaseerd op Hidden Markov Models (HMMer), en is een probabilistisch, netwerk gebaseerd algoritme dat specifieke patronen herkent. Daar op voortbordurend worden een paar simpele, bayesiaanse methoden en tree-based machine learning algoritmen besproken die op annotatieproblemen worden toegepast. Tenslotte worden de databases besproken (FIGFAM, InterPro, CDDB) die deze annotaties opslaan. Een ander onderwerp dat wordt besproken is de precieze werking van assemblyalgoritmen; De Bruijn Graphs. Deze algoritmen zijn ook netwerk-gebaseerd en zijn belangrijk om te kennen omdat ze de uitkomst van assemblies (de genomen) verregaand beinvloeden, en vormen een goede opmaat naar het laatste onderwerp van deze cursus: gene network reconstruction (GRN). GRN is een techniek waarbij allerlei bioinformatica methoden en databronnen gebruikt worden om de metabole routes van een organisme helemaal in kaart te brengen. Hierbij worden proteomics, RNAseq en annotatiedatabases gezamelijk toegepast.

Literatuur en andere bronnen

Literatuur

Jonathan Pevsner, "Bioinformatics and Functional Genomics", 3rd edition, ISBN 978-1-118-58178-0

Web

Blackboard course thema 9

Competenties

Werkvormen

Hoorcollege

Ingangseisen

Ingangseisen toets

Voorkennis

De kennis van Theorie van Bioinformatica 1 & 2 wordt bekend gesteld, alsmede Algoritmen en Datastructuren en Statistiek 1-3

Voorkennis kan worden opgedaan met

Theorie van Bioinformatica 1 & 2 wordt bekend gesteld, alsmede Algoritmen en Datastructuren en Statistiek 1-3

Bronnen van zelfstudie

Verplicht materiaal

Boek, collegesheets

Aanbevolen materiaal

Extra readers uit "Bioinformatics Algorithms" van Compeau & Pevzner en achtergrondartikelen, allen te vinden op de BlackBoard site.

Bio-informatica 3 (vanaf 2019-2020)