Clustering of DNA Sequences in Human Promoters
Genome Res. 2004 Jul 15
有料モノが多い転写因子モノの中で publicly available なソースを使って解析をしてみましたというお話.DNA 8mer(48=65536通り)の中で TSS からの位置(dbtss を利用)によって有意に頻度差がでる配列(パターン)はどれなのかを網羅的に調べている.幾つかは TSS の -100〜0 あたりに集中的に現れており,CAAT や SP1, Kozak 等に対応していた.ひとつだけ既知の TF とは対応つかないものが見つかった(TCTCGCGA)けど,その biological な意味は分からなかった.また,共起しやすい配列パターンの解析や配列(パターン)と GO category の association を調べていた.