• Tidak ada hasil yang ditemukan

細菌の発現制御機構をゲノム ワイドに解析する - J-Stage

N/A
N/A
Protected

Academic year: 2023

Membagikan "細菌の発現制御機構をゲノム ワイドに解析する - J-Stage"

Copied!
9
0
0

Teks penuh

(1)

【解説】

細菌の発現制御機構をゲノム ワイドに解析する

次世代シーケンサーを用いた高精度な網羅的解析の可能性

大島 拓,石川 周

これまで,転写開始点や転写制御因子の結合部位を正確に決 め る た め に は,個 々 の 遺 伝 子 ご と に,プ ラ イ マ ー 伸 長 法 や  DNase I フットプリントをしなければならなかった.ところ が,次世代シーケンサーの登場で,それらの方法と同等の精 度で,ゲノムワイドな解析ができるようになりつつある.こ れらの解析手法の登場で,細菌のゲノム解析は,どこまで分 子メカニズムに迫れるだろう.最近,続々と発表された1 数塩基レベルの解像度をもつ網羅的解析手法について解説し てみたい.

はじめに

1990年代の半ばから,さまざまな細菌のゲノム配列 が決定されてきた.決定された配列から,それぞれの細 菌のもつ遺伝子セットが予測され,それに基づき,代謝 経路,さまざまな生育環境に適応する能力,病原性など に関する情報がもたらされた(1)

.一方,遺伝子の発現制

御に関係する諸要素に関しても,ゲノム配列から情報科

学的に予測することが試みられてきたが,転写開始点,

プロモーター配列,転写単位あるいは転写制御因子の結 合領域などを精度よく予測することはいまだに難し

(2〜4)

.しかしながら,次世代シーケンサーの登場と,

さまざまな解析手法の開発によって,遺伝子の発現制御 に関連するそれらの要素に関しても,ゲノムレベルで,

かつ実験的に情報を収集できる時代になりつつある.

細菌の転写制御システム

細菌の転写開始点とその周辺に存在する転写制御,あ るいは転写後の発現制御にかかわる要素について考えて みよう(図

1

.どのような制御を受けるにせよ,遺伝

子が発現するためにはRNAポリメラーゼがプロモー ター配列に結合し,転写を開始しなければならない.し たがって,転写開始点の上流には,必ずプロモーターが あるはずである.細菌の場合,プロモーターを構成する 配列が,対応する 

σ

 因子ごとに決まっているから(た とえば,大腸菌や枯草菌の主要 

σ

 因子に対応するプロ モ ー タ ー 配 列 は −10[TATAAT] お よ び −35[TT- GACA] 配列)

,それぞれの  σ

 因子に応じたプロモー High Resolution Genome-Wide Analysis of Bacterial Expression 

Regulation

Taku OSHIMA, Shu ISHIKAWA, 奈良先端科学技術大学院大学バ イオサイエンス研究科

(2)

ター配列が,転写開始点の,すぐ上流に存在するはずで ある(図1)

.加えて,低分子RNAやRNAの5

′ 側非翻 訳領域 [5′-UTR (untranslated region)] に存在するリ ボスイッチなども転写を制御していることが知られてい る.ゲノムレベルで転写開始点が決定できれば,これら を正確に予測することができるはずである(図1)

.転

写制御因子は,RNAポリメラーゼがプロモーターと相 互作用し転写開始複合体を形成するのを促進(活性化因 子)

,あるいは,阻害(抑制因子)するために機能する

はずだから,通常,プロモーターの周辺に結合するはず である.この転写制御因子の結合領域を高解像度かつ網 羅的に決めることができれば,発現制御に関連するさま ざまな要素を,ゲノムレベルで,かつ,個々の転写開始 点ごとに把握できる可能性がある.

次世代シーケンス

次世代シーケンサーは,一度に,大量のDNA断片の シーケンスを決定する装置である.現在,イルミナ社の HiSeq, GAII,  あるいはMiSeq,  あるいはロシュ社のGS,  あるいは GS junior と呼ばれるシーケンサーは,1回の 読み取りで,1サンプルあたり数千万本以上(イルミナ 社)あるいは数万本以上(ロシュ社)のDNA断片につ いて,その片方の端,あるいは両端から,数十から数百 bpの塩基配列(リード)を決定することができる.得 られた大量のDNA断片由来のリードを,ゲノム配列と 比較して,ゲノム上の対応する場所にマッピングすれば

(図

2

A, B)

,シーケンスしたDNA断片がゲノムのどの

領域に由来するものかが判断できる.したがって,シー ケンスに用いるDNA断片(シーケンス用に調整された 大量のDNA断片を通常,ライブラリーと呼ぶ)の調製 方法を変えることで,さまざまな解析が可能になる.代 表的なものでは,ゲノムDNA(図2C①)

,RNAから合

成されたcDNA(図2C②)

,特定のDNA結合タンパク

質と相互作用しているDNA(図2C③)などから,ライ ブラリーが調整される.これらの方法を組み合わせ,た とえばRNA結合タンパク質と結合するRNAから作ら れたライブラリーも調整可能である(図2C④)

.最終的

に,回収したDNA断片の両側に次世代シーケンスに必 要とされる短いタグ配列を含むタグDNA断片を結合 し,その配列をもつプライマーを使って,調整した DNA断片をできるだけ少ない回数のPCR(PCRによる 偏り[PCRバイアス]を減少させるため)によりシー ケンスに必要とされる量まで増幅し,ライブラリーの作 成は完了する.このライブラリーをシーケンスして,ゲ ノム上にマッピングした後で,1塩基ごとにマップされ たシーケンスの数を数え上げると(一般的にデプス[深 さ]とか,カバレッジと表現されている)

,ゲノム上の

転写されている領域や,転写の量,タンパク質の結合領 域を決定することができる(図2B)

転写開始点 TSS の網羅解析

転写開始点 [TSS (transcriptional start site)], すなわ ち,RNAの5′ 末端側の配列を網羅的に決定するために 最も効率が良いのはどのような方法だろう? 上述した ように,次世代シーケンサー用のライブラリーに含まれ るDNA断片は,その両側に次世代シーケンスに必要と されるタグ配列をもつDNA断片が付加されている(図 2C)

.次世代シーケンサーで行われるシーケンス反応

は,シーケンスプライマーを,ライブラリー DNAに付 加されているタグDNA配列とハイブリダイズさせた 後,そのシーケンスプライマーの3′ 末端から開始され る(図

3

ス テ ッ プ6)

つ ま り,RNAの5′ 末 端 に タ グ DNA断片が付加したような形のライブラリーを用意し,

そのライブラリーを次世代シーケンサーでシーケンスす れば,決定された塩基配列の5′ 末端がTSSのはずであ る(図3ステップ5, 6参照)

.そこで,TSSの解析には,

図1TSS周辺に存在する発現制御 に関係する諸要素

TSSは矢印で示している(遺伝子を 含むRNAと含まない低分子RNAを 区別して標記した.低分子RNAの候 補になるのは,遺伝子間領域に存在 するRNA,アンチセンスRNA,セ ンス鎖に存在するが,たとえば遺伝 子の中から発現しているなどの理由 で,遺伝子と対応しないRNAであ る).

5’非翻訳領域(5’-UTR)

プロモーター配列 -10 -35

遺伝子の転写開始点 (TSS)

低分子RNAのTSS (遺伝子間領域)

遺伝子 低分子RNAのTSS

(センス)

転写制御因子結合部位

低分子RNAのTSS

(アンチセンス)

(3)

RNAの5′ 末端に,まずシーケンスプライマーと同じ配 列をもつRNAプライマーを付加する(図3ステップ3)

次に,タグ配列の3′ 側にランダム配列をもつプライ マ ー を 用 い てcDNAを 合 成(図3ス テ ッ プ4) し,

cDNAの5′ および3′ 末端にシーケンスに必要なタグ配 列を付加する.最終的に,PCRを用いてcDNAの両端 にシーケンシングに必要とされるタグDNA断片を付加 する(図3ステップ5)

.調整されたライブラリーを用い

てシーケンスを行えば,RNAの5′ 末端の配列が網羅的 に決定できるはずである(図3ステップ6)

.実際に,そ

のような方法でTSSが網羅的に解析された例がある(3)

しかしながら,RNAは精製中に容易に分解してしま うし,rRNAのように5′ 末端が切断されて機能する RNAも存在する.したがって,これらのRNAが混ざっ たまま上記の方法でライブラリーを構築すると,TSS を決定するつもりが,切断したRNAの端を網羅的に決

定することになりかねない.そこで,TSSを5′ 末端に もつRNA(この5′ 末端を,以降,真の5′ 末端と呼ぶ)

を何らかの形で区別し,より選択的にRNAの真の5′ 末 端をシーケンスできるように解析手法が工夫された(図 3ステップ1, 2)

.たとえば,真核生物のTSSの網羅的な

解析では,真核生物のRNAが真の5′ 末端にcap構造 

(Gppp-) をもつという特徴を利用する(図3ステップ1,  2[真核])

.一例を挙げると,アルカリフォスファター

ゼを利用してcap構造をもたないRNAの5′ 末端のリン 酸 基 を 除 去 し,次 に Tobacco Acid Pyrophosphatase 

(TAP) 処理により,RNAの真の5′ 末端のみがリン酸化 されている状態を作り出し(5, 6)

,それらに選択的にRNA

プライマーを付加する(図3ステップ1, 2[真核])

.こ

のようにして作成したライブラリーをシーケンスするこ とで,網羅的にTSSを決定することができる.ところ が,細 菌 のRNAに はcap構 造 が な い.し た が っ て,

図2次世代シーケンス

A : シーケンス結果のマッピング例を 図 示 し た.決 定 さ れ た 塩 基 配 列

[リード]は,テンプレートとなるゲ ノム配列と比較され,対応する位置 にマップされる.B : シーケンスが マップされた後,ゲノムの1塩基ご とに,マップされたDNA断片の本数 をカウントし,いわゆるデプスをゲ ノム配列に対して表示するとこの図 のようになる.C : シーケンスライブ ラリーの調整方法をまとめた.① ゲ ノムDNAの場合,断片化後,両側に PCRおよびシーケンス反応に必要と なるタグ配列を付加し,ライブラ リーを調整.②RNAの場合,cDNA の合成後,2本鎖cDNAを合成し,以 降はゲノムDNAと同様にライブラ リーを調整.RNAのシーケンスライ ブラリーの作成方法は,これ以外に も多数存在し,RNAを断片化してか ら合成を始める方法や,最初にRNA の5′ 末端にタグを付加して方向性が わかる形でライブラリーを作成する 方法もある.取得したい情報に応じ て,方法を選択する必要がある.③ DNA結合タンパク質の結合部位を決 定する場合は,ゲノムDNAを断片化 後,DNA結合タンパク質‒DNA複合 体を精製し,共精製されたDNA断片 からライブラリーを調整.④RNA結 合タンパク質の結合部位を決定する 場合は,③と同様にRNA結合タンパ ク質‒RNA複合体を精製し,精製さ れたRNAから②と同様にライブラ リーを調整.

(4)

TSSの解析には,真核生物とは異なるアプローチがと られている.

細菌の転写開始点 TSS の網羅解析

RNAポリメラーゼによって合成されるRNAの最初に 取り込まれた塩基(真の5′ 末端)には,リン酸基が3つ

(図3ステップ1, 2[細菌]

:ppp-)残っている.一方,

分解されたRNAやtRNAあるいはrRNAの場合,5′ 末 端にリン酸が一つだけ存在する(図3ステップ1[細 菌]

:p-) .この違いを利用することができれば,細菌

RNAの真の5′ 末端にも,選択的にRNAプライマーを付 加することが可能である.都合のいいことに,5′ 末端に 3つのリン酸基 (ppp-) をもつRNAは分解しないが,そ うではないRNAを選択的に分解する特性をもつRNA 分解酵素,Terminator-5′-phosphate dependent exonu- clease(TEX,  エピセンタ社)がある.この酵素によっ てRNAを処理し(図3ステップ1[細菌])

,3つのリン

酸基 (ppp-) を5′ 末端にもつRNAのみが分解されずに 濃縮されたRNAサンプルを調整し(図3ステップ2[細 菌])

,そこからシーケンスのためのライブラリーを作る

ことができる(図3ステップ3以降)

.これまで報告され

ている細菌のTSSの網羅的な解析のほとんどは,基本 的には,この方法をもとに設計された解析法により実施 されており,大腸菌(7)

,サルモネラ菌

(8)

,ピロリ菌

(9)

(7)(10)

(11),   sp. PCC7120(12)

(4),   sp. PCC6803(13),    (14) のTSSが決定されている.わ れわれも乳酸菌を用いて,同様の解析を行い,TSSの 網羅的な解析に成功している(論文準備中)

.古細菌の

TSSの解析にも,この方法は用いられており,

 Gö1 の網羅的なTSSの報告がなされて いる(15)

.しかしながら実際のデータにはTSSに加え,

TEX処理で分解されなかった一つのリン酸基を5′ 末端 にもつRNA由来のシーケンスもバックグラウンドとし て頻繁に検出される.そのため,実際の解析では,TSS のデータのみではなく,ほかのデータとの比較で議論さ れる.

Differential RNA sequencing dRNA-seq

TSSとバックグラウンドを正確に区別するために開 発されたのがdRNA-seqであり,ピロリ菌のTSSの網羅 的な解析(9)  を含む多くの解析で用いられている.Ter- minator-5′-phosphate dependent exonuclease (TEX) 

で処理したRNA由来のライブラリーには,TSSを含む cDNA断片が濃縮されていることを考慮して,TEX処 理サンプル(図

4

A )のシーケンス数が,TEX未処理 サンプル(図4A )のシーケンス数を上回る領域を選 び出し,その領域に存在するシーケンスの5′末端をTSS と判断する(8〜15) (図4A )

RNA

ppp- Gppp- RNA

RNA

ppp p- RNA (分解)

p- RNA (分解)

TEX処理(ステップ1[細菌])

ppp- RNA

TAP処理(ステ プ2[細菌]) ppp

AP処理(ステップ1[真核])

ppp- RNA

RNA (分解)

p- p- RNA (分解)

RNA (分解)

OH-OH RNA (分解)

TAP処理(ステップ2[細菌])

TAP処理(ステップ2[真核])

OH- RNA (分解)

p- RNA

RNA (分解)

OH-OH- RNA (分解)

p- 完全長mRNA

p- RNAプライマーの付加 (ステップ3[共通])

NNNNNN プライマー(ランダム+

タグ配列)

cDNA合成(ステップ4[共通]) PCR (ステップ5[共通])

シーケンス(ステップ6[共通]) シーケンスプライマー

ATCC……

転写が開始された塩基

図3TSS TSS の解析

TSS解析の概要を示した(左側:細菌,右側:真核生物).細菌の ライブラリー作成は,ステップ1で,Termi nator-5′-phosphate de- pendent exonuclease (TEX) により5′ 末端に3つのリン酸基をも たないRNAを分解する.ステップ2で Tobacco Acid Pyrophos- phatase (TAP) を用いて,5′ の3リン酸をモノリン酸に変換し,

RNAプライマーを結合できるようにする.ステップ3で,T4リ ガーゼによりRNAプライマーを,モノリン酸をもつRNAの5′ 末 端に結合し,ステップ4でランダムプライマーなどにより,5′, 3′  の両端にタグ配列をもつcDNAを合成する.ステップ5で,タグ 配列を有するプライマーを用いてPCRし,ライブラリーを調整し た後,シーケンスを行う.真核細胞に用いる,オリゴキャップ法 についても図示した(右側).ステップ1で,アルカリフォスファ ターゼで処理し,cap構造をもたないRNAの5′ 末端に存在するリ ン酸基を取り除く.ステップ2でTAPを用いて,5′ の3リン酸を モノリン酸に変換し,RNAプライマーを結合できるようにした 後,ステップ3でT4リガーゼを用いてRNAプライマーを結合す る.このとき,cap構造をもたないRNA由来のRNAの5′ 末端に は,リン酸基がないため,T4リガーゼを用いて,RNAプライ マーを結合することはできない.

(5)

TSS, RNAポリメラーゼのクロマチン免疫沈降 

ChIP-chipトランスクリプトーム,プロテオー ムの結果を利用した転写単位の決定

複数の解析手法を組み合わせて,ゲノムワイドに転写 単位を決定することも試みられている(3, 4, 7, 8)

.TSSの網

羅 解 析 結 果(図4B )

ト ラ ン ス ク リ プ ト ー ム(図 4B )

,RNAポ リ メ ラ ー ゼ の 結 合 プ ロ フ ァ イ ル(図

4B )

,さらに,場合によってはプロテオーム解析結果

も組み合わせ,転写単位が決定される(図4B )

.これ

は,TSSの近傍には,必ずRNAポリメラーゼが結合 し,それがChIP-chipにより検出され,TSSから始まっ ている転写がトランスクリプトームにより検出され,そ の転写単位から翻訳されるタンパク質がプロテオームに より検出されるはずである,という仮定に基づいてい る.この解析で用いられるトランスクリプトーム情報に は,転写の方向が含まれていたほうが良いため,タイリ

ングアレイを用いたマイクロアレイ解析,あるいは転写 の向きがわかるRNA-seqが用いられることもある.た とえば,サルモネラ菌の解析には,FRT-seq(16) と呼ば れる方法が用いられている(8)

網羅解析が示す発現制御機構の複雑さ

次世代シーケンスを用いた網羅解析により,ゲノム上 のTSSがどの程度検出されているかを,すでに発表さ れている論文をもとに表にまとめた(表

1

.細菌のゲ

ノムサイズや,TSSの検出の方法(細菌の培養条件,

RNAの回収条件,TSSを検出する条件など)が異なる ため,得られた結果を単純に比較することはできない が,1 〜5種類の培養条件を用いて培養された細菌から RNAを精製し,そのRNAを用いて網羅的TSS解析を 行った結果,それぞれの細菌ごとに,おおよそ500 〜 13,000のTSSが検出されている.いくつかの細菌につい ては,既存のTSSの情報を用いた検証が行われており,

65 〜87%の一致が見られている(7, 9, 12, 13)

.既存の情報に

誤りがあるのか,それとも次世代シーケンスによる網羅 的TSS解析の精度に問題があるのかは現状ではわから ないが,今後,解析が進めば,この差がどこから生じる のか明らかになると思われる.  の解析で は,一つの遺伝子の発現が,異なるプロモーターによっ て,細胞の分化に応じて活性化されていることが報告さ れており(10)

,このような転写制御の複雑さが,

「既存の TSS情報」と「網羅的なTSS解析の結果」とが合致し ない理由なのかもしれない.実際に,できる限り多くの 転写単位を検出するため,培養条件によって活性化して いないプロモーターがあることを考慮して,複数の培養 条件でRNAを調整し,解析を行っている例もある.た とえば    の場合,5種類の異なる培養 条件を用いて,網羅的TSSおよびトランスクリプトー ム解析を行い,さらにプロテオームデータを加えて(プ ロテオームデータは12の異なる培養条件を用いてデー タを取得している)転写単位を推定したところ,ゲノム 配列から存在が予想された遺伝子の90%以上を含む転 写単位の推測が可能になった(4)

.表1に示した解析のな

かで,大腸菌, ,    は,

ほぼ同じ解析手法でTSSが抽出されているため,その 比較をすることができる.たとえば,大腸菌と 

 のTSSを比較すると,大腸菌のほうが,一 つのオペロンあたりのTSSの数が多い.すなわち,大 腸菌のほうが,   よりも複雑な転写制 御系をもっていることがわかる(4, 7)

.これは,大腸菌

図4dRNA-seqおよび転写単位の解析

A : dRNA-seqについて図示した.横軸が,シーケンスがマップさ れたゲノム上のポジション,縦軸がデプスを示している.TEX処 理をせず,図3のステップ2[細菌]からライブラリー作成作業を 行うと,精製したRNAの5′ 末端すべてにRNAプライマーを結合 することができる(TAP処理後はすべてのRNAの5′ 末端にモノ リン酸がついているから).したがって,RNAの真の5′ 末端が選 択的に多くシーケンスされることはない.  TEX処理をすると,

RNAの真の5′ 末端が選択的に多くシーケンスされる.  両者を 比較し,TEX処理をしたサンプル由来のシーケンス数が,TEX 処理をしなかったサンプル由来のシーケンス数を上回った領域を 探しだし(この図の場合,図の左側のピーク),その領域の5′ 末 端がTSS(青矢印)とみなされる.B : 転写単位の決定について図 示した.A同様,横軸が,シーケンスがマップされたゲノム上の ポジション,縦軸がデプスを示している.TSS に加え,タイリ ングアレイやRNA-seqにより決定されたゲノム上の転写活性化領 域 , ChIP-chipにより決定されたRNAポリメラーゼの結合領域 , を重ね合わせると になる.その結果,特定のTSS(青矢印)

によりコントロールされる転写単位(赤線)が決定される.

(6)

が,多様な環境に適応して生育しなくてはいけないのに 対し,   は非常に限定された環境で生 育しているためではないかと説明されている.

すでに述べたとおり,TSSが決まれば,−10および 

−35配列の位置が,かなり正確にわかるので,大腸菌,

サ ル モ ネ ラ 菌,ピ ロ リ 菌, , 

  に関して,TSS上流の −10, −35  配列の保存 性に関する検討がなされている(7〜10)

.興味深いことに,

ピロリ菌では−10配列は保存されているが,−35配列 は周期性をもつアデニンとチミンに富む配列に置き換 わっている(9)

.また,サルモネラ菌と大腸菌を比較する

と,−10および−35配列の保存性はともに高いが,サ ルモネラ菌では−10と−35配列の間に存在する ex- tended −10 と呼ばれる配列が大腸菌より保存されてい ることが報告されている(8)

ゲノム配列から予測された遺伝子の1塩基目から,

TSSまでの距離を割りだすことで,RNAの5′ 側に存在 する非翻訳領域 (5′-UTR) の長さに関する解析も行われ て い る.細 菌 の5′-UTRの 長 さ は,20 〜 40 bpが 多

(7〜10)

,非常に長い5

′-UTRをもつ転写単位も多数存在

する.ピロリ菌では,発現制御に関連するシス因子(リ ボスイッチなど)が存在する可能性が高い60 bp以上の 長さ(17) をもつ5′-UTRが337個見つかったことが報告さ れている.一方,大腸菌と   間で保存さ れている遺伝子について,その5′-UTRを比較したとこ ろ,  の5′-UTRのほうが,大腸菌より長

い傾向があることがわかった.加えて,遺伝子領域,プ ロモーター領域と比べると,5′-UTRの塩基配列の多様 性が最も高い(7)

.このことから,5

′-UTRが,細菌の発 現制御の多様性に大きく寄与している可能性があると筆 者らは述べている.ゲノム配列から予想された遺伝子の 位置とTSSの位置との比較は,遺伝子のアノテーショ ンの精度を向上させる面もある.たとえば,ピロリ菌で は 遺伝子に対応するTSSが,予想されていた遺伝 子の開始コドンより下流に検出された.検出された TSSより下流に,シャインダルガルノ (SD) 配列を伴っ た開始コドンが存在し,その開始コドン以降の塩基配列 がピロリ菌株間で保存されていることから, 遺伝 子の開始コドンの位置は,30 bp程度下流にずらされて いる(9)

.網羅的TSSおよびトランスクリプトーム解析

の結果をもとに,ピロリ菌では19遺伝子,サルモネラ 菌では5遺伝子が再アノテーションされている(8, 9)

網羅的TSS解析の結果は,トランスクリプトーム解 析と併用することで,低分子RNAの検出にも用いるこ とができる.ただし,TEXを用いた網羅的なTSS解析 では,切断による修飾を受ける低分子RNAに関して は,切断前の前駆体RNAの5′末端が検出される点には 十分注意する必要がある(7)

.大腸菌に関する網羅的

TSS解析の結果では,既知の低分子RNAのTSSが,網 羅的TSS解析によって,高い効率で検出されることが 示されており,網羅的TSS解析は,低分子RNAの解析 に非常に効果的な手法であることが示唆されている(7)

表1これまで発表されたTSS解析の結果

細菌種名a ゲノムサイズ 検出したTSSの数 低分子RNA 培養条件の数 文献

大腸菌 (MG1655) 4.6 Mbp(染色体)   3746     58b 1 (7)

(  MGH78578) 5.3 Mbp(染色体)と5つの

プラスミド (0.38 Mbp)   3143     36b 1 (7)

ピロリ菌 1.6 Mbp(染色体)   1907 1026d 2 (9)

(  strain 26695)

サルモネラ菌

(  serovar Typhimurium SL1344)

4.8 Mbp(染色体)と3つの

プラスミド (0.19 Mbp)   1873   140c 1 (8)

3.8 Mbp(染色体)   1374     34b 5 (4)

(  PCA)

 sp. PCC6803 3.6 Mbp(染色体)と4つの

プラスミド (0.37 Mbp)   3527 2362d 1 (13)

 sp. PCC7120 6.4 Mbp(染色体)と6つの

プラスミド (0.43 Mbp) 13705 9519d 2 (12)

1.2 Mbp(染色体)     565     75 2 (10)

(  CWL029)

a本文中には, と   のTSS解析についての記述もあるが, は遺伝子上流に存在するTSS,  

に関してはCRISPRに関するTSSについて解析を行っているので,この表には含めない.b大腸菌, および の低分子RNAは,すでにアノテーションされているsRNA(大腸菌),情報解析によりあらかじめ予想された低 分子 RNA ( と  ) のうち,TSSおよびトランスクリプトーム解析により発現が検出された数を示 す.c低分子RNA候補から,遺伝子をコードしていない可能性があるRNAうち,長さが500 bp以下のものを選択している.d遺伝 子をコードしていない可能性があるRNAをすべて含んでいる.

(7)

実際に  では,ゲノム上の低分子RNAの 存在位置をプログラムで予測し(18)

,予測された低分子

RNAが発現しているかどうかをTSS解析およびトラン スクリプトーム解析により検証している.予測された 48の低分子RNAのうち,36の低分子RNAの発現が確 認されている(7)

.サルモネラ菌の場合,TSS解析,トラ

ンスクリプトーム解析に加え,RNA結合タンパク質で あるHfqと共精製されたRNAを用いたRNA-seqデータ も用いて(図2C④参照)

,60の新規低分子RNAが見い

だされている(8, 19)

.これらの結果を見ると,細菌の発現

制御機構は想像以上に複雑であり,まだ知られていない 発現制御機構が多数存在していることが推察される.

転写制御因子のDNA結合部位の高精度マッピング ク ロ マ チ ン 免 疫 沈 降 法(ChIP-chipあ る い はChIP- seq)を用いることにより,ゲノム上の転写制御因子の 結合領域を網羅的に決定できる.ChIP-seq法の概要を,

5

A(右側)に示した.クロマチン免疫沈降法は,目 的の転写制御因子に対する抗体を用いて行うこともでき るし,解析したい転写制御因子(DNA結合タンパク質)

にタグペプチド(ヒスチジンタグやフラッグタグなど)

を付加した融合タンパク質を発現する細胞を作製し,利 用することもできる.まず,細胞をホルマリン処理し,

DNA結合タンパク質とゲノムDNAをクロスリンクす る.次に,超音波破砕により細胞を破砕すると同時に,

ゲノムDNAも断片化する.得られた細胞破砕液から,

クロスリンクされた目的の転写制御因子‒DNA複合体を アフィニティー精製し,そのDNA断片を用いてシーケ ンスライブラリーを作製する(図5A右側:ChIP-seq)

この方法は,よく確立された方法で,大腸菌や枯草菌を 使って,再現性の高い解析ができる(20, 21)

.しかしなが

ら,超音波破砕によってDNAを断片化するために,転 写制御因子と共精製されるDNA断片のサイズが大きく なり (〜500 bp), 解像度が一定以上には上がらないとい う欠点がある(21)

.転写制御因子が結合する結合領域の

サイズは,500 bpよりは,はるかに小さく,数十bp程 度なので,転写制御にかかわる要素を正確に決定するこ とを目標にするのであれば,やはり数十bp以下の解像 度で結合領域を決定したい.そこで,われわれは,

ChIP-seqの簡便さを生かしつつ,より解像度を上げる ため,超音波による細胞破砕の前に,DNA分解酵素で ある DNase I によりゲノムDNAを消化した後,細胞を 破壊して,転写制御因子‒DNA複合体を精製することに した(図5A左側:GeF-seq)(21)

.この方法を用いて,枯

図5GeF-seq

A : GeF-seqとChIP-seqの違いを図示した.ステップ1;ホルマリ ンで細胞を処理し,DNA結合タンパク質とゲノムDNAをクロス リンクする.ステップ2 ; GeF-seqでは,リゾチームや変性剤によ り,細胞壁に穴をあける.ステップ3 ; DNase Iを加え,細胞内で ゲノムDNAを分解する.DNA結合タンパク質と結合した部分は 分解せずに残るが,それ以外のゲノムDNAは分解される.ステッ プ4 ; 超音波で細胞を破砕する.ステップ5 ; DNA結合タンパク質

‒DNA複合体を共精製する.ステップ6 ; タンパク質に結合してい たDNA断片を精製する.ステップ7 ; タグ配列を付加し,ライブ ラリーを調整する.B : ChIP-chip, ChIP-seq, GeF-seq  の解像度の 違いを図示した.縦軸は,シグナル強度 (ChIP-chip) とデプス 

(ChIP-seq, GeF-seq) を示している.横軸はゲノム上のポジション である.高さが高い部分が,AbrBの結合領域とされる.ChIP- chipとChIP-seqでは500 〜 1000 bpの一つのピークとしてしか検 出できない結合領域が,GeF-seqでは3つの50 bp程度のピークと して検出された.

(8)

草菌のグローバルな転写抑制因子であるAbrBの枯草菌 ゲノムDNA上の結合部位を網羅的に解析したところ,

ChIP-chipあるいはChIP-seqでは,数百bpの幅をもつ ピークとして検出されたAbrB結合部位が,数十bpの 幅しかないピークとして検出された(図5B)

.この数十

bpの結合ピークの幅は,これまで試験管内フットプリ ント法により決定されていたAbrBの4量体の結合領域 の大きさとほぼ一致したことから,この解析手法で得ら れたピークの幅は,おそらくAbrBの結合領域と重なっ ていることが推測できた(21)

.この手法の解像度が,

ChIP-seqより高いことは別の点からも示されている.

図5Bで示すように,ChIP-chipやChIP-seqでは,これ まで一つのピークとして検出されてきたAbrB結合領域 が,本手法により,実際は,複数のAbrB結合部位を含 んでいることが示された.われわれは,この方法を細胞 内で,かつ,ゲノムレベルでフットプリント解析を行う 方法として,  Genome Footprinting with high- throughput sequencing (GeF-seq) と名づけ(21)

,現在,

ほかのタンパク質のマッピングにも適用しているところ である.真核生物の転写制御因子やRNAポリメラーゼ に関しては,異なる手法で,網羅的な高解像度マッピン グが行われている.この方法は,ChIP-seqと同様,細 胞を超音波破砕し,ゲノムDNAを断片化した後,転写 制御因子‒DNA複合体をアフィニティー精製する途中に Exonuclease IIIで処理することで,転写制御因子‒DNA 複合体に含まれているDNA断片をタンパク質と結合し ている境界まで分解することで,解像度を高めてい る(22〜24)

おわりに

ここまで述べてきたように,図1で示した発現制御に 関連するゲノム上の諸要素は,次世代シーケンサーを用 いた解析手法により,ゲノム配列上に,1 〜数塩基レベ ルの解像度で,マップすることが可能になった.興味を もった細菌のゲノム配列を決定した後,本稿で紹介した ような解析手法を用いて解析を行えば,発現制御機構の 概要までゲノムレベルで把握することができる.そのよ うな状態から,個々の興味深い遺伝子について解析を始 めることも,今後,増えていくのかもしれない.同時 に,分子レベルの解析が,これまであまり行われてこな かった非モデル細菌のTSS, プロモーター (−10, −35) 

配列や,転写因子の結合部位など,発現制御機構の細か な要素について,高解像度かつ網羅的に解析が進めば,

それらを比較することにより,細菌の進化に関する新た

な側面も明らかになるかもしれない.得られたデータの 情報解析など,今回紹介した解析を,簡便に行えるよう になるためには,まだまだ整備が必要な点も多いが,こ れまで不可能だった解析が次世代シーケンサーの登場に より可能になり,大きな可能性を示していることは間違 いがない.

謝辞:本稿で紹介した,われわれが行った研究の一部は,科学技術振興 機構 (JST), 戦略的国際科学技術協力推進事業および先端的低炭素化技 術開発 (ALCA) の支援を受け行われ,奈良先端科学技術大学院大学の  Onuma Chumsakul 博士,坂本智昭博士,倉田哲也准教授,小笠原直毅 教授,前橋工科大学の中村建介准教授,ノッチンガム大学 Jon Hobman  准教授との共同研究の成果である.

文献

  1)  P.  Stothard  &  D.  S.  Wishart : , 9,  505 (2006).

  2)  N. C. Kyrpides : , 27, 627 (2009).

  3)  B. K. Cho, K. Zengler, Y. Qiu, Y. S. Park, E. M. Knight, C. 

L. Barrett, Y. Gao & B. O. Palsson : , 27, 1043 

(2009).

  4)  Y. Qiu, B. K. Cho, Y. S. Park, D. Lovley, B. O. Palsson & 

K. Zengler : , 20, 1304 (2010).

  5)  R.  Yamashita,  N.  P.  Sathira,  A.  Kanai,  K.  Tanimoto,  T. 

Arauchi, Y. Tanaka, S. Hashimoto, S. Sugano, K. Nakai & 

Y. Suzuki : , 21, 775 (2011).

  6)  Y.  Suzuki,  K.  Yoshitomo-Nakagawa,  K.  Maruyama,  A. 

Suyama & S. Sugano : , 200, 149 (1997).

  7)  D. Kim, J. S. Hong, Y. Qiu, H. Nagarajan, J. H. Seo, B. K. 

Cho, S. F. Tsai & B. O. Palsson : , 8, e1002867 

(2012).

  8)  C.  Kroger,  S.  C.  Dillon,  A.  D.  Cameron,  K.  Papenfort,   S.  K.  Sivasankaran,  K.  Hokamp,  Y.  Chao,  A.  Sittka,  M. 

Hebrard, K. Handler  : , 

109, E1277 (2012).

  9)  C. M. Sharma, S. Hoffmann, F. Darfeuille, J. Reignier, S. 

Findeiss, A. Sittka, S. Chabas, K. Reiche, J. Hackermuller,  R. Reinhardt  : , 464, 250 (2010).

  10)  M. Albrecht, C. M. Sharma, M. T. Dittrich, T. Muller, R. 

Reinhardt,  J.  Vogel  &  T.  Rudel : , 12,  R98 

(2011).

  11)  M. Albrecht, C. M. Sharma, R. Reinhardt, J. Vogel & T. 

Rudel : , 38, 868 (2010).

  12)  J.  Mitschke,  A.  Vioque,  F.  Haas,  W.  R.  Hess  &  A.  M.  

Muro-Pastor : , 108,  20130 

(2011).

  13)  J. Mitschke, J. Georg, I. Scholz, C. M. Sharma, D. Dienst,  J. Bantscheff, B. Voss, C. Steglich, A. Wilde, J. Vogel 

: , 108, 2124 (2011).

  14)  E. Deltcheva, K. Chylinski, C. M. Sharma, K. Gonzales, Y. 

Chao,  Z.  A.  Pirzada,  M.  R.  Eckert,  J.  Vogel  &  E. 

Charpentier : , 471, 602 (2011).

  15)  D. Jager, C. M. Sharma, J. Thomsen, C. Ehlers, J. Vogel 

& R. A. Schmitz : , 106, 21878 

(2009).

  16)  L. Mamanova, R. M. Andrews, K. D. James, E. M. Sheri- dan, P. D. Ellis, C. F. Langford, T. W. Ost, J. E. Collins & 

D. J. Turner : , 7, 130 (2010).

  17)  Z. Weinberg, J. E. Barrick, Z. Yao, A. Roth, J. N. Kim, J. 

Gore, J. X. Wang, E. R. Lee, K. F. Block, N. Sudarsan 

(9)

: , 35(14), 4809 (2007).

  18)  E. P. Nawrocki, D. L. Kolbe & S. R. Eddy : ,  25, 1335 (2009).

  19)  A.  Sittka,  S.  Lucchini,  K.  Papenfort,  C.  M.  Sharma,  K. 

Rolle,  T.  T.  Binnewies,  J.  C.  Hinton  &  J.  Vogel : , 4, e1000163 (2008).

  20)  C. Kahramanoglou, A. S. Seshasayee, A. I. Prieto, D. Ib- berson, S. Schmidt, J. Zimmermann, V. Benes, G. M. Fra- ser  &  N.  M.  Luscombe : , 39,  2073 

(2011).

  21)  O. Chumsakul, K. Nakamura, T. Kurata, T. Sakamoto, J. 

L.  Hobman,  N.  Ogasawara,  T.  Oshima  &  S.  Ishikawa :   , in press.

  22)  H. S. Rhee & B. F. Pugh : , 147, 1408 (2011).

  23)  H. S. Rhee & B. F. Pugh : , 483(7389), 295 (2012).

  24)  K. Yen, V. Vinayachandran, K. Batta, R. T. Koerber & B. 

F. Pugh : , 149, 1461 (2012).

プロフィル

大 島  拓(Taku OSHIMA)    

<略歴>1997年東京大学大学院理学系研 究科生物化学専攻修了/同年持田製薬株式 会社バイオサイエンス研究所研究員/1999 年科学技術振興事業団・研究員/2002年 奈良先端科学技術大学院大学助手/2007 年同大学院大学助教(現職)<研究テーマ と抱負>細菌の核様体の構造と機能<趣 味>ベランダ菜園

石 川  周(Shu ISHIKAWA)    

<略歴>1994年信州大学繊維学部応用生 物学科卒業/1999年3月信州大学博士課程 修了/同年4月アメリカ・スクリプス研究 所研究員/2001年日本学術振興会特別研 究員/2002年奈良先端科学技術大学院大 学助手(助教)<研究テーマと抱負>細菌 の細胞分裂,染色体複製,転写,核様体構 造<趣味>読書

Referensi

Dokumen terkait

【解説】 ゲノム解読が進むにつれ,糸状菌には,これまで同定された 化合物から予測されるよりも,はるかに多くの二次代謝物を 生産する能力が秘められていることが明らかになってきた. 二次代謝物生合成遺伝子の大半は,通常の培養条件下では休 眠状態にあり,われわれは,その能力の一部しか引き出せて いない.最近,急速に解明されつつある,エピジェネティク

遺伝子発現レベルの解析 下面発酵酵母の DNA マイクロアレイを活用し,異なる発酵 温度での Sc 型と Lg 型の遺伝子発現調節を解析し,オーソロ グ間で発現パターンの異なる遺伝子が存在することを明らかに した 図 2.一つの細胞内に 2 種類のゲノムセットが混在し て,共に発現している生物は興味深い.いかにしてこれらの遺