分子性物質の超伝導発現機構、理論的解明/転写開始点の標準データセット構築
理化学研究所生命医科学研究センター 大容量データ管理技術開発ユニット ユニットリーダー・粕川雄也
転写開始点の標準データセットを構築
生物では、ゲノム中に書かれた遺伝子のDNA配列情報を鋳型にRNAが「転写」される。RNAは、肝臓や皮膚などの臓器、神経細胞や幹細胞などの細胞、臓器形成期や成人期などの時期に応じて、必要なものが転写されるよう正確に制御されており、転写の異常により病気が引き起こされることもある。
転写は、さまざまな要素が複合的に組み合わさって制御されているが、全ての転写制御に関わる要素や転写されるRNAは、「転写開始点(TSS)」と結びつけられる。そのため、ゲノム中の全てのTSSの場所が分かれば、これを基準に全ての転写制御に関するデータや転写されるRNAの情報をまとめられることになる。
今回、理研の研究チームは、公共データベースなどで公開されているRNAの転写開始側の配列が含まれた実験結果を収集して再解析し統合することで、ヒトやマウスのゲノムに存在する標準データセット「refTSS」を構築した。refTSSデータセットには、約22.4万個のヒトTSSと約17.3万個のマウスTSSの情報が、ゲノム上での位置やさまざまな付加情報とともにまとめられている。さらに、インターネット上で公開されており、制限なしで利用できる。
本研究成果は、転写制御研究のための基本ツールとして利用することで、生命現象や疾患のメカニズムを転写レベルで理解するための研究の効率化に貢献すると期待できる。
◇
【プロフィル】粕川雄也
かすかわ・たけや 大阪大学大学院基礎工学研究科、NTTソフトウェア株式会社、理化学研究所発生・再生科学総合研究センター、同ライフサイエンス技術基盤研究センターを経て、2018年から現職。
■コメント=生命科学分野の多様かつ大量のデータの山から、まだ見ぬ大発見を探し出したい。