R-Bioconductor - rtracklayer
Дисклемер - краткое описание функционала инструмента импорта/экспорта файлов геномных аннотаций.
rtracklayer используется как интерфейс между R, геномным браузером и геномными аннотациями. Главный функционал - ввод/вывод табулированных (в т.ч. сжатых) файлов геномных аннотаций: GTF/GFF, BED, WIG, BedGraph, BED15 и BigWig. Загружает файлы аннотаций в GRanges, способен различать разные версии GFF если указывать точный формат, WIG также хранит в виде GRanges.
Специфическая ошибка из-за чувствительности к разделителям в последних столбцах GFF показала баг в выводе UCSC Table Browser - лишние пробелы в концах строк.
Ввод/вывод сессий и треков браузера не интересен, гораздо важнее скриптовый веб-интерфейс к UCSC Table Browser: задаются базовые параметры сессии, и по имени треки и таблицы загружаются в виде GRanges аннотации в пределах указанных диапазонов GRanges.
rtracklayer используется как интерфейс между R, геномным браузером и геномными аннотациями. Главный функционал - ввод/вывод табулированных (в т.ч. сжатых) файлов геномных аннотаций: GTF/GFF, BED, WIG, BedGraph, BED15 и BigWig. Загружает файлы аннотаций в GRanges, способен различать разные версии GFF если указывать точный формат, WIG также хранит в виде GRanges.
Специфическая ошибка из-за чувствительности к разделителям в последних столбцах GFF показала баг в выводе UCSC Table Browser - лишние пробелы в концах строк.
Ввод/вывод сессий и треков браузера не интересен, гораздо важнее скриптовый веб-интерфейс к UCSC Table Browser: задаются базовые параметры сессии, и по имени треки и таблицы загружаются в виде GRanges аннотации в пределах указанных диапазонов GRanges.
library("rtracklayer") # import BED, GTF, WIG setwd("~/Ubuntu One/evfr/redumeres/peak detection/") bedpeak <- import("hs_merged_en10peaks.bed", asRangedData = F) setwd("/media/data/db/danio/track/") gtfanno <- import("zv9_danrer7_refgene.gtf", asRangedData = F) setwd("~/Ubuntu One/evfr/redumeres/peak detection/") wigcov <- import("dr1_uniq_peak-coverage.wig", asRangedData = F) # UCSC browser is not cool. UCSC download tables is cool! session <- browserSession("UCSC") genome(session) <- "hg19" track.names <- trackNames(ucscTableQuery(session)) # good list # set track and table loadingtrack <- "wgEncodeGencodeV17" loadingtable <- "wgEncodeGencodePseudoGeneV17" loadregion <- GRanges("chr10", IRanges(5000000, 8000000) block <- getTable( ucscTableQuery(session, range = loadregion, track = loadingtrack, table = loadingtable) )