alt FUW
logo UW
other language
webmail
search
menu

Seminarium Zakładu Biofizyki

sala B2.38, ul. Pasteura 5
2019-06-14 (14:15) Calendar icon
Katarzyna Węgrzyn (IFD UW)

Dekonwolucja chmur odczytów za pomocą minimizerów na potrzeby asemblacji de novo
Deconvolution of read clouds with minimizers for genome de novo assembly

Duża zmienność osobnicza ludzkiego genomu powoduje niedokładność asemblacji (ang. assembly) opartej o genom referencyjny. Sekwencjonowanie genomowe można przeprowadzić z wykorzystaniem krótkich lub długich odczytów. Oba podejścia mają swoje zalety i ograniczenia. Nowy typ danych nazywany odczytami połączonymi (ang. linked-reads) otrzymywany z technologii Chromium GEMs jest konsensusem pomiędzy dokładnością krótkich odczytów i daleko-zasięgową informacją otrzymywaną z długich odczytów. Jednak narzędzia powiązane z tą technologią nie wykorzystują w pełni potencjału odczytów połączonych. Asemblacja de novo prowadzona jest w sposób tradycyjny. Krótkie kody (ang. barcodes) przypisane odczytom połączonym wykorzystywane są jedynie do rozdzielania składanej sekwencji na haplotypy i porządkowania niejednoznacznych fragmentów zawierających warianty strukturalne. Wykorzystanie informacji zawartej w odczytach połączonych, w celu składania sekwencji de novo, jest utrudnione ze względu na niewystarczające pokrycie genomu w pojedynczych chmurach odczytów. W niniejszym projekcie zaproponowano nowe podejście do składania sekwencji de novo poprzez dekonwolucję chmur odczytów z wykorzystaniem minimizerów. Minimizery mogą być wykorzystane do porównywania i grupowania odczytów związanych z różnymi chmurami w celu zwiększenia pokrycia sekwencji genomowej i umożliwienia asemblacji.
High diversity of a human genome induces inaccuracies in genome assembly based on a reference genome. Genome sequencing can be done using short reads or long reads. Both approaches have its advantages and limitations. A novel data type called linked-reads, retrieved from Chromium GEMs technology, can be used as a consensus between availability and simplicity of short reads and long range information of long reads. However Chromium toolkit does not harness full potential of linked-reads. De novo assembly process goes in a conventional way. Barcodes characterizing linked-reads are used only for phasing haplotypes and detangling spurious fragments with structural variants. Using linked-reads information from the bottom of de novo assembly is limited by the low sequence coverage in individual read-clouds. We propose a new approach to de novo assembly with linked-reads by read-clouds deconvolution using minimizers. Minimizers can be used for reads comparison and grouping leading to higher coverage and facilitating assembly.

Wróć

Wersja desktopowa Stopka redakcyjna