Heavy Watal

rtracklayer

https://www.bioconductor.org/packages/devel/bioc/html/rtracklayer.html

読み書き

https://genome.ucsc.edu/FAQ/FAQformat.html

GFF, BED, bedGraph, BED15, WIG, BigWig, 2bit <—> GRanges, GRangesList

import(filename, format, text, ...)
ファイルあるいは文字列を読み込んで GRanges に変換する。 format は拡張子から判断してくれる。 import.gff(), import.bed() など形式ごとの関数も定義されていて、 引数などの詳しいヘルプもそっちから見られる。

GFFは feature.type="exon" などとして興味のある行だけ読んだほうが良さそう。 結果として、余分な列も減る。

export(gr, filename, format, ...)
GRanges をGFFなどの形式でファイルに書き出す。

UCSC Table Browserにアクセス

https://genome.ucsc.edu/cgi-bin/hgTables

ゲノム、トラック、テーブルの指定方法が独特

session = browserSession()
genome(session) = "hg19"
query = ucscTableQuery(session, "knownGene")
tableName(query) = "kgXref"
kgXref = getTable(query)  # data.frame

query = ucscTableQuery(session, "knownGene", "hg19", "kgXref")

テーブルを指定しなければ先頭が使われる

query = ucscTableQuery(session, "cytoBand", "hg19")
cytoBand = track(query)  # GRanges

トラックやテーブルの名前を閲覧

trackNames(session)
tableNames(query)