Module: Bio-informatica 2

In schooljaar 2018-2019 is dit voor Thema 9 (jaar 3) de module Theorie van Bio-informatica 2!

Gegevensveld	Waarde
Osiriscode	OSIRISCODE
ECTS	3
Toetsvorm	Schriftelijk tentamen
Minimum cijfer	5,5
Docent(en)	HEMI
Contactpersoon	HEMI
Voertaal	Nederlands

Cursusdoelen (leerdoelen)

De gebruikte software voor NGS expressieanalyse kennen, en weten hoe deze in pipelines te plaatsen om statistisch verantwoord expressiestudies te doen
Het algoritme van mapping software (Burroughs-Wheeler Transform) kennen en begrijpen wat de afwegingen zijn die het zo snel maken maar ook False Negatives veroorzaken
Begrijpen hoe een expressie (RNAseq) experiment opgezet moet worden om statistisch valide biologische conclusies te trekken
Weten hoe het Assemblyproces werkt om "nieuwe" genomen uit NGS DNAseq data te maken en wat de belangrijkste typen software en hun settings zijn, en hoe deze het resultaat beinvloeden.
Het process van Variant Calling (SNP's, indels) gebaseerd op een mappingpipeline begrijpen

Inhoud

Dit vak gaat over twee belangrijke NGS technieken: RNAseq (expressiestudies) en DNAseq t.b.v. genoomassembly

Dit vak behandelt de geavanceerde algoritmen die nodig zijn om de grote hoeveelheden data die Next Generation Sequencing produceert te kunnen verwerken. Eerst wordt er gekeken naar de overtreffende trap van alignment algoritmen: mapping software zoals BWA, Bowtie2 en STAR. Er wordt ingegaan op het algoritme van Bowtie2 als voorbeeld van de keuzes die afgewogen worden om mapping software snel genoeg te maken om honderden miljoenen NGS reads snel genoeg te verwerken. Ook wordt er ingegaan op de "pipelines" die meestal gebruikt worden om expressiedata te verwerken. Preprocessing Quality Control (PHRED scores en trimming) worden uitgelegd, daarna de mapping en variant-call stappen en hoofdtypen van de gebruikte bestanden (fastq, SAM, BAM, vcf) . Er wordt ingegaan op de statistiek van expressie-experimenten en van variant calling. Tenslotte wordt ook assembleren besproken; het proces waarmee nieuw-gesequenced organismen hun genoom wordt bepaald. Het algoritme wordt vluchtig besproken, de nadruk ligt op praktische aspecten zoals het optimaliseren van de genoomgrootte, en de experimentele (lab) opzet die gebruikt kan worden om de assembly te verbeteren. De nadruk ligt weer op het ontwikkelen van praktisch toepasbare kennis, pipelines die gebruikt kunnen worden en de voor- en nadelen van verschillende software pakketten zoals Velvet, BamBus, Arachne, SPADEs.

Literatuur en andere bronnen

Literatuur

Bioinformatics and Functional Genomics 3rd ed (2015). Jonathan Pevsner. ISBN 978-1-118-58178-0

Bio-informatica 2

Module: Bio-informatica 2

Cursusdoelen (leerdoelen)

Inhoud

Literatuur en andere bronnen

Competenties

Werkvormen

Ingangseisen

Ingangseisen toets

Voorkennis

Voorkennis kan worden opgedaan met

Bronnen van zelfstudie

Verplicht materiaal

Aanbevolen materiaal

results matching ""

No results matching ""