• Tidak ada hasil yang ditemukan

KaPPA-Average 1.0 マニュアル

N/A
N/A
Protected

Academic year: 2024

Membagikan "KaPPA-Average 1.0 マニュアル"

Copied!
12
0
0

Teks penuh

(1)

KaPPA-Average 1.0

マニュアル

第 1.0 版

制作者: かずさDNA研究所 櫻井 望 制作日: 2010年1月12日

目次

1. はじめに ··· 2

1-1. KaPPA-Averageとは··· 2

1-2. 動作環境··· 3

1-3. インストールと起動··· 3

2.操作説明··· 4

2-1. メイン機能 - Calc. Average··· 4

2-1-1. データの準備··· 4

2-1-2. 実行··· 6

2-1-3. 出力データ··· 6

2-2. プローブID - 遺伝子ID対応表の作成支援機能··· 7

2-2-1. データの準備··· 8

2-2-2. 実行··· 10

2-2-3. 出力データ··· 11

(2)

1.はじめに

2

1. はじめに

1-1. KaPPA-Average とは

KaPPA-Averageは、KaPPA-View(http://kpv.kazusa.or.jp/kpv4/)でマイクロアレイ データを解析する際に便利なデータ変換ソフトウェアです。

一般のマイクロアレイでは、一つのプローブが複数の遺伝子に対応していることがあ るので、遺伝子を主体に考えた場合、どのプローブのデータを採用して良いか判断に 迷うことがあります。KaPPA-View に搭載されている遺伝子情報も、例えばモデル植 物シロイヌナズナでは、TAIR(http://www.arabidopsis.org/)が整備しているAGI番 号で管理されているため、各社のマイクロアレイのプローブ番号との対応を考える必 要があります。

KaPPA-Averageでは、プローブと遺伝子間の多対多の関係を考慮して、アレイで検出

されたプローブごとのデータを、遺伝子ごとのデータに変換することができます。ひ とつの遺伝子に複数のプローブが対応している場合、遺伝子のデータは、対応するプ ローブの平均として計算されます。

KaPPA-View は、遺伝子発現データを代謝マップへあてはめることにより、変動の傾

向を大まかに理解することを主な目的としていますので、このような平均化処理は、

Average Calculator Microarray Data

Probe to Gene Table

Resulted Data

(3)

KaPPA-Average マニュアル

3

解析の最初のステップとしては有効と思われます。

1-2. 動作環境

KaPPA-AverageはJavaで作成されたソフトウェアです。ご使用には、Java Runtime

Environment 1.5.0以上がインストールされたOSが必要です。

OS:

Windows XP/Vista (Microsoft) Mac OS X (Apple)

Linux

1-3. インストールと起動

ダウンロードしたzipファイルを解凍し、適当な場所に保存してください。解凍したフ ォルダに含まれるKaPPA-Average.jarをダブルクリックすると、ソフトウェアが起動 します。

起動画面

(4)

2.操作説明

4

2.操作説明

KaPPA-Averageには、以下の二つの機能があります。

1.メインの機能

マイクロアレイで得られたプローブごとのデータから、プローブIDと遺伝子IDの対 応表をもとに、遺伝子ごとのデータに変換します。

2.プローブIDと遺伝子IDの対応表を作成するための支援機能

タブ区切りテキストなどを処理して、1.で使用する対応表を作成します。

2-1. メイン機能 - Calc. Average

「Calc. Average」のタブでは、本ソフトウェアのメイン機能である、データ変換を行 います。

2-1-1. データの準備

①ID対応ファイル

以下のように、1列目にプローブID、2列目に遺伝子IDが記述されたタブ区切りテキ ストをご用意ください。ヘッダー行はなく、1行目からデータが始まっていることにご

①プローブ ID と遺伝子 ID の対応 関係を記したファイルを選択し ます。

②変換もととなる、マイクロアレ イで得られたプローブごとの検 出データを記したファイルを選 択します。

③出力データの保存場所を入力し、変換を実行します。

(5)

KaPPA-Average マニュアル

5

注意ください。

一つのプローブIDが複数の遺伝子IDに対応している場合などは、それぞれ個別の行 として記載します(上図の3列目と4列目など)。

②データファイル

マイクロアレイで得られた、プローブごとの検出データは、以下のようなフォーマッ トとしてご準備ください。

1行目: ヘッダー行(必須)

2列目以降のデータに対する実験名(データ名)を記入してください。

2行目以降: データ部分(必須)

1 列目にプローブ ID、2 列目以降に各実験で得られたデータ(数値)を記入してくだ さい。

(6)

2.操作説明

6

※実験データ(2列目以降)は何列あってもかまいません。

ファイル形式: タブ区切りテキストとして保存してください。

注意

・データ部分に空白や数値以外の文字が入力されていると、エラーとなります。

・プローブIDが重複しないようにしてください。重複していた場合、一番下の行に書 かれたデータのみが有効になります。

2-1-2. 実行

2つのデータファイルが選択された状態で「START」ボタンを押すと、変換後のデー タを保存するファイル名を問い合わせるダイアログボックスが開きます。保存するフ ァイル名を入力すると、処理が始まります。

Statusに「Finished.」という文字が現れれば、処理は終了です。

2-1-3. 出力データ

変換後の出力ファイルは、以下のようなタブ区切りテキストファイルとなっています。

また、出力ファイル名の拡張子が「.log」となっているファイルも同時に出力されます。

(例えば、出力ファイル名が「result.txt」であれば、「result.log」)

(7)

KaPPA-Average マニュアル

7

ログファイルには、一つの遺伝子に複数のプローブが対応していた場合に、出力ファ イルに書き出された平均化データ(Averageと書かれた行)と、平均計算のもととなっ たプローブごとのデータが出力されます。

どのプローブのデータを採用すべきかを検討したり、またこれをもとにID対応表を詳 細に編集したりする際にお役立てください。

2-2. プローブ ID - 遺伝子 ID 対応表の作成支援機能

「ID File Formatter」のタブでは、「Calc. Average」で使用するプローブIDと遺伝子 IDの対応表を作成するための支援機能を提供しています。

マイクロアレイのメーカーなどが提供する情報ファイルには、2-1で示したようなフォ ーマットとは別の形で、プローブと遺伝子の対応関係が記されている場合があります。

例えば、各プローブIDに対応する遺伝子IDが、セミコロンやスペースなどで区切ら れた文字列として、1行で書かれている場合があります。

例)TAIRが提供するAgilent社のプローブIDとAGIコードとの対応関係表

(8)

2.操作説明

8

ID File Formatterでは、このように1行で書かれたデータを、Clac. Averageで使用 できる複数行形式に変換することができます。

2-2-1. データの準備

もととなるデータは、以下のようなフォーマットとして保存してください。

1列目: プローブID

2列目: 遺伝子IDが適当な区切り文字で区切られたもの。

ファイルはタブ区切りテキストとして保存してください。

また以下のように、2列目以降の遺伝子IDがタブで区切られ3列以上が存在するよう なたようなファイルも処理することができます。このような 3 列以上が存在するファ

①1 行形式で書かれたプローブ ID と遺伝子 ID の対応ファイル を選択します。

②遺伝子 ID 部分の区切り文字 を選択あるいは入力します。

③出力ファイル名を入力し、処理を実行します。

(9)

KaPPA-Average マニュアル

9

イルは、区切り文字の選択で「<tab>」を指定した時のみ処理可能です(後述)。

注意

・ヘッダー行はありません。

・区切り文字にカンマが使用されている場合、MicrosoftのExcelでタブ区切りテキス トとして保存すると、下図のように、両脇にダブルクォーテーションが挿入されるこ とがあります。このようなデータは適切に処理されません。

例)Excelで「タブ区切りテキストとして保存」したファイルを、テキストエディタで

開いたところ

これを防ぐには、以下のように、テキストエディタで空のテキストファイルを作成し、

このなかにExcelのセルをコピーしてペーストします。

テキストエディタで、新規ファイルを作成。

Excelでデータ部分をコピー

(10)

2.操作説明

10

テキストエディタに貼り付け

2-2-2. 実行

①「Target File」欄で2-2-1で準備したファイルを選択します。

②「ID Separator」の部分で、2列目の遺伝子IDの区切り文字を選択、あるいは入力 します。

<tab>は、2列目以降の遺伝子IDがすべてタブ区切りとして保存された3列以上のフ

ァイルに対して用います。

<space>は、遺伝子IDの区切り文字として、一つ以上の半角スペースが用いられてい

る場合に使用します。

その他の区切り文字として、デフォルトではセミコロン(;)が選択できます。他の区

(11)

KaPPA-Average マニュアル

11

切り文字にしたい場合には、ここに区切り文字を入力してください。

例)カンマ(,)を設定した例

③「START」ボタンを押すと、出力ファイル名を問い合わせるダイアログボックスが 現れ、ファイル名を入力すると処理が始まります。Statusの欄に「Finished.」と表示 されれば、処理は終了です。

2-2-3. 出力データ

出力データは、2-1で紹介したような形式となっています。区切り文字で区切られてい た遺伝子IDは、複数行に書き出されています(下図の3行目、4行目を参照)。

区切り文字で区切られていた文字列は、すべて遺伝子IDとして書き出されます。もと になるデータによっては、プローブが対応する遺伝子がない場合に「no_match」など と記載されていることがありますが、このような文字列は、除去されずに残っていま す。出力ファイルを得た後は、適切な対応関係が書き出されているかどうかを必ずチ ェックし、必要があれば手作業で除去してください。

出力ファイル名の拡張子が「.log」となっているファイルも同時に出力されます。

(例えば、出力ファイル名が「id_formatted.txt」であれば、「id_formatted.log」)

(12)

2.操作説明

12

このログファイルには、一つのプローブIDが複数の遺伝子IDに対応していた場合、

その個数が書き出されています。データの解釈において、そのプローブを採用するか どうかの判断材料としてご活用ください。

Referensi

Dokumen terkait

12, 2014 た.そこで,この菌の固定子(Balc-MotPS)を解析す ることとした.Vedder1934株は,遺伝子操作が確立さ れていなかったので,Balc- 遺伝子を大腸菌の固 定子欠損株に発現させた.すると,その運動性を相補で きた.そこで,このモーターを遺伝子工学が容易な大腸 菌の系で解析した.その結果,このモーターは,MotPS

9, 2012 625 今日の話題 リンパ球のゲノムでは遺伝子座の周囲に存在する カ セット と呼ばれる短い配列を遺伝子内部に取り込み, タンパク質をコードできる完全な構造となり,多様性を 獲得していたのである(図3).この結果から,Cooper らは,この遺伝子が抗体のようにリンパ球でのみ組み換 えを起こす新しい抗原受容体であると結論づけ,“Vari-

5, 2017 細菌の遺伝子重複による環境適応 遺伝子の「多コピー化」という細菌のサバイバル戦略 細菌が環境に適応する遺伝的要因の一つに,ゲノム DNAの一部が重複することによる多コピー化がある(遺 伝子重複).このような遺伝子重複は,複製の過程でし ばしば起こり,個々の細菌細胞に「個性」を生じさせる だけでなく,遺伝的多様性を確保することにもつながっ

長鎖DNA調製法:大規模な代謝工学の先鞭 20世紀の遺伝子工学で扱える遺伝子は数個に限られていた. 確実に合成できる DNA サイズが 10 kbp程度との制約があっ たからである.ものづくりの対象物質は二次代謝産物が多い. 代謝経路は多数の遺伝子が関与しており,それら多数の遺伝子 発現を効率よく制御するには,すべての遺伝子を一つの分子に

1, Apr., 2020 高等動物の GAD には複数の遺伝子の存在が明 らかになり,それぞれ別のタンパク質産物を合成 する.遺伝子産物のサイズの違いより,GAD65 と GAD67 というアイソフォームに区別される. ノックアウトという遺伝子欠損させたマウスの研 究より,GAD65 遺伝子を欠落させると痙攣を頻 発し死亡し,GAD67 遺伝子を欠落させると上あ

3 / 5 検査名: 【遺伝性ヘモクロマトーシス遺伝子検査】 概略 遺伝性ヘモクロマトーシス HFE は主に常染色体劣性遺伝性の鉄の代謝異常疾患で ある。腸の鉄吸収の増加を特徴とし、その結果、全身の臓器に鉄が過剰に沈着して臓器 障害をきたす。 本検査ではHFE,HJV,HAMP,TFR2,SLC40A1遺伝子のタンパク質コード領域エクソンとそ

3 / 5 検査名: 【無虹彩症遺伝子検査】 概略 無虹彩症は虹彩が完全または不完全に欠損していることで見出される遺伝性疾病で、 常染色体優性遺伝形式を示す。責任遺伝子はPAX6遺伝子である。本疾患は出生時から両 眼性の強い視力不良を認め、大半が視覚障害児となる。本疾病の発症頻度は10万人に1

3 / 5 検査名: 【BHD 症候群遺伝子検査】 概略 BHD症候群は多発性肺嚢胞、腎癌、顔面などの皮疹を特徴とする常染色体優性遺伝の 疾患である。原因遺伝子としてfolliculinFLCNが知られている。 本検査では FLCN 遺伝子のタンパク質コード領域エクソンとその両端のスプライス部 位領域を次世代シークエンサーで解析し、主に検出されたアレル頻度