発現配列タグ

発現配列タグ(EST)



発現配列タグ(Expressed Sequence Tag, 略称: EST)とは、遺伝子の研究において用いられる短いDNA断片です。これは、細胞内で実際に機能している遺伝子から転写されたRNAを鋳型にして作られる相補的DNA(cDNA)の一部をシーケンス解析することで得られます。ESTは、特定の時点で発現している遺伝子の一部を示しており、遺伝子の同定やその配列情報の取得に重要な手がかりを提供します。

ESTの取得は比較的迅速に行うことが可能であり、2013年時点では、世界中の公開データベース(GenBankなど)に7400万種類を超えるESTが登録され、研究者によって広く利用されていました。

特徴と用途



ESTは、cDNAライブラリに含まれる個々のクローンを一度だけシーケンス解析することで生成されます。得られる配列は、一般的に断片が短く、現在の技術では数百ヌクレオチド程度(約500〜800塩基)の比較的限定的な情報となります。しかし、この短い配列でも、それがどの遺伝子由来であるかを推測するのに十分な情報を含んでいることがあります。公開データベースに登録されているESTは、cDNAまたはmRNAの配列、あるいはmRNAを合成する際の鋳型となる鎖の配列を示しています。

ESTは多様な遺伝学研究に応用されます。例えば、RHマッピング、HAPPYマッピング、蛍光 in situ ハイブリダイゼーション(FISH)といった物理的な手法を用いてESTが染色体上のどこに位置するかを調べることで、そのESTが由来する遺伝子染色体上の位置を推定できます。また、対象となる生物種の全ゲノム配列が解読されている場合は、計算機解析によってEST配列をゲノム配列にアラインメント(対応付け)することで、遺伝子の位置や構造をさらに詳しく調べることが可能です。

ESTは、遺伝子の存在そのものを証明する証拠としても重要です。2006年時点では、ヒトの遺伝子セットにおいて、その存在がESTのデータのみに基づいて予測されている遺伝子が数千個も存在しました。ESTは、これらの遺伝子からどのような転写産物が作られるかを予測し、さらにタンパク質産物やその機能の予測へと繋げるための有力なツールです。加えて、ESTが得られた組織、器官、または疾患状態(例: がん組織)といった情報は、対応する遺伝子がどのような状況で機能しているかを知る手がかりとなります。さらに、ESTに含まれる情報は、DNAマイクロアレイのプローブ設計にも利用され、網羅的な遺伝子発現プロファイルを決定するために役立ちます。

歴史的背景



mRNAのDNAコピーを作成し、それを増幅するという基礎的な技術は、1970年代後半にハーバード大学カリフォルニア工科大学の研究者によって開発されました(1979年)。cDNAライブラリからランダムにクローンを選んで配列を決定するというアイデアは、1980年代初頭にGreg Sutcliffeらによって探求され(1982年)、実際に178種類のcDNAクローンの配列決定が行われました(Putneyら、1983年)。そして、1991年にAdamsらによって「EST」という用語が提案され、由来のcDNA約600種類を対象とした、より体系的なEST配列決定プロジェクトが開始されました。

データソースと管理



ESTデータは「dbEST」というデータベースに集約されています。これはGenBankの一部として1992年に設立され、世界中の研究室から直接データが提出されています。提出されたデータは原則としてそのまま公開されるため、厳密な品質管理(キュレーション)は行われていません。

しばしば、同じ遺伝子やmRNAに対応する多数の異なるESTが得られます。下流の解析を効率化するために、これらのESTを統合して「ESTコンティグ」と呼ばれるより長い配列にまとめる試みが行われています。TIGR gene indices、UniGene、STACKなどが主要なESTコンティグデータを提供しています。ただし、コンティグの構築は複雑な過程であり、異なる遺伝子の配列が誤って結合されるなどの問題が発生する可能性もあります。生物種の全ゲノム配列が利用可能な場合は、ESTを直接ゲノム上の転写産物領域にマッピングする方が、より正確な情報が得られることもあります。

ESTデータの解析におけるもう一つの課題は、サンプルが採取された組織や疾患状況に関する情報管理です。dbESTでは、組織情報が英語のプレーンテキストで記載されていることが多く、コンピュータで自動的に処理しにくいという問題がありました。例えば、「glioblastoma」(膠芽腫)のような記載は、組織由来であり、かつがん組織であることを意味しますが、これを機械的に解釈するのは容易ではありませんでした。また、がん以外の疾患状況は記載されていないこともしばしばでした。これらの課題を解決するため、2000年に「TissueInfo」プロジェクトが開始されました。このプロジェクトは、組織と疾患状況に関するキュレーションされたデータを提供し、組織間の包含関係を示すオントロジーを構築し、さらにゲノム情報とEST由来の組織発現データを関連付けるためのソフトウェアを提供することで、ESTデータのより高度な解析を可能にしました。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。