Module: Theorie Bioinformatica 3

Deze module draait vanaf schooljaar 2019-2020

Gegevensveld Waarde
Osiriscode OSIRISCODE
ECTS 3
Toetsvorm Schriftelijk tentamen
Minimum cijfer 5,5
Docent(en) HEMI
Contactpersoon HEMI
Voertaal Nederlands

Cursusdoelen (leerdoelen)

  • Netwerk-gebaseerde algoritmen kennen en begrijpen (zoals toegepast in assembly, hidden markov models, gene network reconstruction)
  • De tegenwoordige "beste" algoritmen voor fylogenie kennen en de daardoor geproduceerde stambomen op accuratesse kunnen beoordelen
  • Annotatiesoftware en databases kennen en kunnen toepassen op nieuw te annoteren sequentiedata
  • Begrijpen waarom de door HMMer geproduceerde Hidden Markov Models lijken op de models die door Machine Learning geproduceerd worden als "representatie" van een te annoteren biologisch concept

Inhoud

Dit vak begint met een tweede blik op fylogenie, en dan specifiek hoe fylogenie gebruikt kan worden bij epidimiologische vragen en in de menselijke genetica (stambomen). Onder andere error-correctie en parsimony-based methoden worden besproken om de huidige, state-of-the art van fylogenie helder te krijgen. Dit vak behandelt ook geavanceerde methoden om annotatie van NGS data en algemener biologische functionaliteit herkennen in grote hoeveelheden data. Het eerste, snelle algoritme is gebaseerd op Hidden Markov Models (HMMer), en is een probabilistisch, netwerk gebaseerd algoritme dat specifieke patronen herkent. Daar op voortbordurend worden een paar simpele, bayesiaanse methoden en tree-based machine learning algoritmen besproken die op annotatieproblemen worden toegepast. Tenslotte worden de databases besproken (FIGFAM, InterPro, CDDB) die deze annotaties opslaan. Een ander onderwerp dat wordt besproken is de precieze werking van assemblyalgoritmen; De Bruijn Graphs. Deze algoritmen zijn ook netwerk-gebaseerd en zijn belangrijk om te kennen omdat ze de uitkomst van assemblies (de genomen) verregaand beinvloeden, en vormen een goede opmaat naar het laatste onderwerp van deze cursus: gene network reconstruction (GRN). GRN is een techniek waarbij allerlei bioinformatica methoden en databronnen gebruikt worden om de metabole routes van een organisme helemaal in kaart te brengen. Hierbij worden proteomics, RNAseq en annotatiedatabases gezamelijk toegepast.

Literatuur en andere bronnen

Literatuur

  • Jonathan Pevsner, "Bioinformatics and Functional Genomics", 3rd edition, ISBN 978-1-118-58178-0

Web

  • Blackboard course thema 9

Competenties

  • nvt

Werkvormen

  • Hoorcollege

Ingangseisen

-

Ingangseisen toets

-

Voorkennis

  • De kennis van Theorie van Bioinformatica 1 & 2 wordt bekend gesteld, alsmede Algoritmen en Datastructuren en Statistiek 1-3

Voorkennis kan worden opgedaan met

  • Theorie van Bioinformatica 1 & 2 wordt bekend gesteld, alsmede Algoritmen en Datastructuren en Statistiek 1-3

Bronnen van zelfstudie

-

Verplicht materiaal

  • Boek, collegesheets

Aanbevolen materiaal

  • Extra readers uit "Bioinformatics Algorithms" van Compeau & Pevzner en achtergrondartikelen, allen te vinden op de BlackBoard site.

results matching ""

    No results matching ""