• Tidak ada hasil yang ditemukan

第2回 地球規模生物多様性情報機構 (GBIF)

N/A
N/A
Protected

Academic year: 2024

Membagikan "第2回 地球規模生物多様性情報機構 (GBIF)"

Copied!
8
0
0

Teks penuh

(1)

1.はじめに─経緯

 地球規模生物多様性情報機構(GBIF)は,地球上 に生息していた生物および生息している生物の情報を 網羅的にアーカイブして,生物多様性の研究ならび に保全と利用を支援しようとする国際共同事業であ る.この GBIF は,生物多様性とは縁遠い存在にみえ る経済協力開発機構(OECD)から生まれた.OECD は加盟国に対して科学技術政策についても提言をする 機能も持っていたが,世紀の節目に,バイオに関する 科学技術政策について 2 つの重要な提言をした.一つ は,米国の提案が採択されてメガサイエンス・フォー ラ ム に 設 け ら れ た Working Group on Biological  Informatics の 報 告(1999 年 ) を 受 け て,GBIF と Global Neuroinformatics Capability(GNC)の設立を 提言した(http://www.gbif.org/GBIF̲org/facility/ 

OECD̲Endorsement).もう一つは,日本の提案が 採択されて Working Party on Biotechnology に設け られた Task Force on Biological Resource Centres

(BRC)の報告(2001 年)に基づいて,Global BRC  Network(GBRCN) の 設 立 を 提 言 し た(http://

www.wdcm.org/brc.pdf).

 OECD の 2 つの提言の中で,GBIF 構想が最も早く 実現した.それは,1992 年のリオ地球サミットで提 案された「生物多様性条約(CBD)」を巡る議論の過 程で,各国政府が,網羅的な生物多様性情報の必要 性を大なり小なり認識していたからであろう.OECD における検討が終息した後も,生物多様性条約にサイ

ンしていないにもかかわらず Working Group の設置 を提案した米国のみならず,オランダ,オーストラリ ア,メキシコなど多数の国々の専門家の熱意が絶える ことなく,ついに 2001 年 3 月に GBIF が発足した.

2.組織

 GBIF の組織は,Governing Board(理事会)と Executive Committee(執行委員会)のもとに,常設 の科学委員会,予算委員会,規約委員会ならびに各国 に設けられる GBIF 対応機関であるノードの管理者委 員会に加えて,資格審査委員会などの臨時委員会が設 けられている(図 1).科学委員会にはさらに図 1 の 下段に示す 4 つの小委員会 DADI,DIGIT,ECAT な らびに OCB が設けられている.図 1 の右側にある事 務局は国際入札の結果,2001 年に選定されたコペン ハーゲン大学動物博物館が運営している.事務局長は, 

OECD の Working Group 以来 2007 年 5 月まで,米 国 National Science Foundation に在籍しながら一貫 してリーダーシップを発揮してきた James Edwards 博士が努めてきたが,その退任に伴った公募審査の結 果,南アフリカ出身の Nick King 博士が任命された.

 GBIF の 運 営 方 針 は 年 1 回 開 催 さ れ る 総 会 で 決 定 さ れ る. 総 会 の メ ン バ ー は,Memorandum of  Understanding(MOU)にサインした国ならびに国 に準ずる組織体と NGO である.2006 年から 2007 年 にかけて新たな MOU の締結が進みつつあり,2007 年 9 月の時点で 27 カ国が MOU に署名または署名 見込みである.これらの国々からの拠出金によって GBIF の活動が賄われることになる.2006 年度の予算 国立遺伝学研究所 生命情報・DDBJ 研究センター 〒411‑8540 静岡県三島市谷田 1111

Global biodiversity information facility (GBIF)

Hideaki Sugawara

Center for Information Biology and DDBJ, National Institute of Genetics   1111 Yata, Mishima, Shizuoka 411-8540, Japan

E-mail: [email protected]

(2)

菅原秀明 地球規模生物多様性情報機構(GBIF)

はおよそ 300 万ユーロであったが,日本は米国ととも にこの予算の多くを担っている.GBIF 総会が扱うこ の予算に加えて,資金を拠出していない国々や学術団 体を含む総会メンバーがそれぞれ生物多様性情報の収 集・評価・保存・提供に投資している.すなわち,実 データは各メンバーの努力によって産み出されてお り,GBIF はそれらを統合利用できる情報システムを 構築・提供している.

3.機能

 GBIF の事業内容は http://www.gbif.org/ にて閲 覧可能であり,GBIF のデータを検索・閲覧するため のポータルサイトは http://www.gbif.net/ であった.

利用者が実際にアクセスするデータポータルサイト は,応答時間を短縮することを目的として,アクセス してきた IP アドレスに最も近いミラーサイトが開く 設定になっている.しかし,アジアのミラーサイトは 1GBIFの組織

2GBIFの情報システム概念図

(3)

2006 年から 2007 年にかけて行われた大幅な改訂に未 対応である.このため,改訂後のデータポータルサイ トについては当面 http://data.gbif.org/welcome.htm を利用されたい.さて,2007 年 9 月時点で,データポー タルサイトから,各国に分散した 203 のデータ提供機 関が提供する 13,500 万件余りのデータを統合検索す ることが可能になっている.検索に利用可能なデータ 項目など,この統合検索の仕組みについては「4.情 報システム」で紹介する.

 GBIF は,2003 〜 2006 年の第 1 期試行期間の後,

2007 年から第 2 期に入り,2011 年には既知の生物種 を 100%網羅する 10 億件のデータを提供することを 目指している(図 2 の「GBIF 自ら構築する情報資源」).

加えて,既存の文献情報,分子生物学の情報,地理情報,

環境情報,気象情報,さらには社会経済情報(図 2 の「参 照する情報資源」)との連携を実現する情報環境の構 築を目指している.この情報環境は,誰でも,何処でも,

何時でも,目的に合わせて必要な情報資源を組合せて,

多様な生物の検索,分析,保全,応用を進めていくた めの基盤となる.将来,図 2 の左下からの矢印で示唆 するように,課題を GBIF の検索エンジンに与えると,

検索エンジンが学名(Electric Catalog of Names)を 参照した上で,GBIF のディレクトリを介して,標本 データ,DDBJ/EMBL/GenBank(http://www.insdc.

org/)の塩基配列データ,地理情報,社会経済情報お よび環境情報などをそれぞれ取得した上で,とりまと

めて報告を戻してくれるようになる.

4.情報システム 1)検索例

 データポータルサイトのトップページの上半分を図 3‑1 に紹介する.図 3‑1 の左下の窓に,生物種名,生 物が由来する国名あるいはデータプロバイダまたは データセットの名称を直接記入して検索を開始する ことができる.あるいは,トップページの下半分に,

Explore species, Explore countries ならびに Explore  datasets の選択肢が示されるので,これらから一つを 選択した後に検索にとりかかってもよい.なお,選択 肢の部分の面積が大きいので図 3‑1 ではこの部分を省 3‑1GBIFデータポータルサイトのトップページ(上半分)

3‑2 3‑1Explore speciesを選択した場合に表示 される画面

(4)

菅原秀明 地球規模生物多様性情報機構(GBIF)

略した.さて,Explore species を選択すると,検索 キーワード入力用の窓と Kingdom の選択用リストが 表示される(図 3‑2).Explore countries を選択する と,国名の頭文字のアルファベットのリストが表示さ れるので,例えば J をクリックすると図 3‑3 の画面と なる.Explore datasets を選択すると,国名の場合と 同様にアルファベットのリストが表示されて例えば N をクリックすると図 3‑4 の画面となる.

 ここで具体の検索を行ってみよう.図 3‑2 の画面 の検索窓に Anabaena と入力して Search ボタンをク リックすると,図 3‑5 に示すように Anabaena が上 位概念の Kingdom: Bacteria から各 species までのリ ストへと展開される.ここで see overview page をク リックすると,採集あるいは観測された位置が緯度と 経度で記述されているデータについて世界地図にマッ

プした結果がまず表示される.図 3‑6 に Anabaena を 選択した結果を示す.緯度と経度それぞれが 1 度の範 囲の地域(セル)が,標本あるいは観測数に応じて暗 色の背景の中に 6 段階の暖色で塗りつぶされる.なお,

渡り鳥を検索の対象に選ぶと,GBIF データポータル サイトに接続した web ブラウザ上に,季節ごとの移 動が見事に表示される.

 上記の場合に限らず,なんらかの検索結果が表示さ れた画面で,利用者は該当するデータをダウンロード したり,検索条件を追加変更して新たな検索結果を得 ていくことができる.幅広いデータを組合せて解析す ることが多い生物多様性の研究においては,web ブ ラウザでデータを閲覧するとともに,必要なデータ をダウンロードできる機能が必須である.また,web ブラウザで検索する道(human interface)の他に,

3‑3 Explore countriesのページにおけるアルファベットリストでJをクリックした場合に表示される国名 リスト

3‑4 Explore datasetsのページにおけるアルファベットリストでNをクリックした場合に表示されるリス トの一部

(5)

3‑5 図3‑2の画面でAnabaenaSearchをクリックした結果の一部

3‑6GBIFデータポータルで表示されるAnabaenaの分布

(6)

菅原秀明 地球規模生物多様性情報機構(GBIF)

手元のコンピュータに用意したコンピュータプログ ラムから直接データを検索できる道(programmatic  interface)も必須である.GBIF においては,pro- grammatic interface が web サービスによって実現さ れている.

2)web サービス

 GBIF では実データが中央のサーバにアーカイブさ れているわけではなく,インターネットの多数のサ イトに分散している.しかも,各サイトではデータ ベース管理システムをはじめとして,それぞれ多様な 情報技術が使われている.それでは,どのような情報 技術によって図 2 の問題解決環境を構築しているだ ろうか.GBIF は,各サイトの情報システムの多様性 を GBIF の仲間として相互理解可能なように包み込む

(wrap)技術として web サービス(http://www.xml.

nig.ac.jp/)を採用した.各サイトは,GBIF が提供す るツールを使い,GBIF 標準のデータ構造,GBIF 標 準の通信プロトコールに変換し,手元のデータを利用 可能な形にして提供することになる.標準データ構 造と標準プロトコールとして,現在のところ,ノード のおよそ 3 分の 2 が DarwinCore と DiGIR(http://

digir.sourceforge.net/)を,ヨーロッパを中心とする

およそ 3 分の 1 が ABCD と BioCASE(http://www.

biocase.org/)を使っている.

 GBIF における標準のデータ構造(すなわち,分散 したデータベースを統合検索するための共通項目)の 具体例として DarwinCore を表 1‑1 に紹介する.表 1‑1 は,Extensible Markup Language(XML)のタ グとしての表現のため,通常の英文では必要なスペー スが圧縮されているが,タグ名からその項目の意味す るところは汲み取ることができる.この DarwinCore の微生物菌株データへの適応度を高めるために,世 界微生物株保存連盟の有志とベルギーの GBIF ノード は,DarwinCore に表 1‑2 のデータ項目を追加するこ とを提案し DarwinCore のドキュメントに記載すると ころまで到達したが,GBIF のシステムにはまだ実装 されていない.このため,表 1‑2 の項目を含めて,表 1‑1 に記載されていないデータ項目については,個々 のノードにおいて検索対象になるにとどまっている.

 国立遺伝学研究所の GBIF 日本ノードの場合は,国 内の生物多様性情報をリレーションナルデータベース 管理システムの一つである MySQL に格納し,GBIF のツールを使って DarwinCore と DiGIR に対応して いる.他のノードでも,種々のリレーショナルデータ ベース管理システムで独自に運用しているデータベー スを,GBIF が提供するデータ項目のマッピングツー ルを使って,手元のデータベースが GBIF 標準の形式 1‑1 GBIFが設定した標準のデータ項目リスト

DarwinCoreの場合)

DateLastModified MonthCollected InstitutionCode DayCollected CollectionCode JulianDay

CatalogNumber TimeOfDay

ScientificName CotinentOcean BasisOfRecord Country

Kingdom StateProvince

Phylum County

Class Locality

Order Longitude

Family Latitude

Genus CoordinatePrecision

Species BoundingBox

Subspecies MinimumElevation

ScientificNameAuthor MaximumElevation

IdentifiedBy MinimumDepth

YearIdentified MaxomumDepth MonthIdentified Sex

DayIdentified PreparationType TypeStatus IndividualCount CollectorNumber PreviousCatalogNumber FieldNumber RelationshipType Collector RelatedCatalogItem

YearCollected Note

1‑2 DarwinCoreの微生物 菌株への拡張案 HistoryOfDeposit Depositor YearDeposited MonthDeposited DayDeposited Substrate Isolator IsolationMethod ConditionsForGrowth GeneticallyModified Genotype

Mutant Race

AlternateState StrainProperties StrainApplications FormOfSupply Restrictions BiologicalRisks Pathogenicity

(7)

の GBIF 自ら構築する情報資源と参照する情報資源の 統合例となっている.

3)Globally Unique Identifier(GUID)

 GBIF は,学名を多様な情報資源を連携させるキー と設定してきたが,GBIF によって,異なるサイトか らの情報の相互参照が可能になるデータが増えれば増 えるほど,1 件 1 件のデータの源である標本や菌株の 単位で特定する必要があることが明らかになってき た.また,学名の背景にある分類群の概念もサイト間 で必ずしも共通ではない.そこで,物理的実体である 標本や菌株から始まって,研究機関や,さらに概念ま で,生物に関するあらゆる対象(オブジェクト)に地 球上で一意の識別子(GUID)を付与する枠組みの検 討が始まった.GUID を定義して運用できれば,デー タの源である物理的実体を厳密に特定することが可能 になり,再現性があり,かつ無駄な重複が無い研究の 促進につながる.

 GUID の技術的基盤には,Digital Object Identifier

(DOI, http://www.doi.org/)や Life Science Identifier

(LSID, http://lsid.sourceforge.net/)といった候補が あるので,生物材料の変異や,一部または全部の複製・

増殖といった特徴に十分注意を払い,かつ GUID の 適用範囲を絞り込めば,バイオ GUID を十分実現可 能と考えられる.またバイオ GUID の議論は,国際 塩基配列データベース(http://www.insdc.org/)と も協調して進んでいくことだろう.

5.Barcode of Life(BoL)

 GUID は,生物オブジェクトに人為的に識別子を付 与する枠組である.これに対して,塩基配列を生物 種の識別子にしようという試みが,Barcode of Life

(http://www.barcodinglife.org/)である.GBIF は BoL の国際コンソーシウムのメンバーとなって,相 互に密接な連携を保っている.

 塩基配列によるバーコード付けは,比較的短い塩基 配列によって生物種を特徴付けようとする技術であ る.したがって,特定の生物種内では共通し,生物種 間で変異が大きい部分配列を選択することになる.動

物標本の場合は,ミトコンドリア DNA の COL1 を  ターゲットとして配列決定とデータ蓄積が始まってい る.BoL の成果は,分類学者だけでなく生物試料を 同定しようとする研究者技術者全てにとって有用な技 術である.この技術は,特定の生物集団の専門家でな くても利用でき,従来の手法では同定が困難か不可能 であった生物試料の同定も可能となる.バクテリアの 場合は,16s RNA の配列が分類と同定に決定的な役 割を果たしており,種のレベルでのバーコード付けが されている.植物については,BoL は適切な分子あ るいは分子群を検討中である.BoL のホームページ によれば,2007 年 9 月の時点で 31,974 種にバーコー ドが付与され,DDBJ/EMBL/GenBank には 5 万件弱 の BoL エントリーが登録されている.

6.おわりに─課題

 2005 年に公表された GBIF に対する第 3 者評価は,

  It is the right initiative with the right goals at  the right time

  In our view, if it did not exist, it would need to  be created

という記述に集約できる.この中間評価をもとに,第 2 期の計画が立てられたが,予算は限られている.

 昆虫の場合「およそ 95 万種が知られている一方で,

推定 800 万種も未知種が生息している」と言われてい ることから(Watson  ., 1995),全生物種を網羅す るまでには遥かな道のりであり,第 2 期の目的である

「180 万種 10 億件の生物多様性情報を提供する」の達 成にしても,これから相当の努力が必要である.

 また,第 2 期はデータの質の向上が大きな課題に なる.Kingdom ごとに登録されている微生物デー  タ の 件 数 を,GBIF が 提 供 す る Representational  State Transfer(REST, http://xml.nig.ac.jp/tuto- rial/rest/index.html)を使ってコンピュータプログ ラムで集計したところ,表 2 が得られた.一方で,

図 3‑1 の GBIF データポータルに設定されている

(8)

菅原秀明 地球規模生物多様性情報機構(GBIF)

Explore Species をクリックして表示される Kingdom のリストは図 3‑2 にあったように Animalia, Archaea,  Bacteria, Chromista, Fungi, Plantae, Protozoa および  Viruses となっている.コンピュータプログラムから アクセスした結果と web ブラウザからアクセスした 結果が不整合なことがまず問題であるが,この問題 から,図らずも GBIF においてある程度データの品 質管理が行われていることが分かる.前者は各デー タプロバイダが Kingdom として表示した結果をまと めたものであり,GBIF データポータルのリストは GBIF が種々の学名辞書を照合してデータを検証した 結果だからである.一方で,国立遺伝学研究所の日 本ノードでは,GBIF が参照する学名辞書の更新に 遅れがあるため,学名として認められた微生物菌株 名であるにもかかわらず,Kingdom が GBIF データ ポータル上では unknown になったままの例がある.

また,微生物系統保存機関の略称が書かれているべ き InstitutionCode の一覧をとってみると,CABI や CBS といった納得できる値以外に,英文字 1 文字や 単なる数字が格納されているなど,疑問を持たざるを 得ない値が各データ項目に散在している.さらに,表 1‑2 の項目が実装されていないことも含めて,微生物 菌株の保全と利用のために必要十分なデータ項目が用 意されているか否か,検証の必要がある段階である.

 したがって,GBIF を真に使える情報資源へと育成 していく過程において,日本の微生物の専門家が貢献 していく可能性が広がっていることになる.また,他

の分野でも,日本政府として資金を拠出することと並 行して,日本の専門家が GBIF に対して貢献していく ことが望まれる.

追 記

 新しい GBIF データポータルに対応して GBIF 日本 ノードのポータルサイトも 2007 年 11 月に改訂しまし た.URL アドレスは http://gbif.ddbj.nig.ac.jp/ です.

どうぞお試し下さい.

謝 辞

  本 稿 は, 国 立 遺 伝 学 研 究 所・ 生 物 遺 伝 資 源 情 報 総 合 セ ン タ ー が 発 行 し て い る ニ ュ ー ス レ タ ー

「BioResource now!」の 2006 年 2 月号に掲載された

「Global Biodiversity Information Facility(GBIF)

-2011 年 GBIF は 180 万種 10 億件の生物多様性情報を 提供する -」を改訂したものであり,この投稿をお認 めいただいた国立遺伝学研究所 山崎由紀子准教授に 感謝致します.

文 献

Watson,  R.T.,  Heywood,  V.H.,  Baste,  I.,  Dias,  B.,  Gamez, R., Janetos, T., Reid, W. & Ruark, G. (eds.)  (1995).  Global  Biodiversity  Assessment-Sumary  for  Policy-Makers,  Cambridge  University  Press,  Cambridge.

  (担当編集委員:笠井文絵)

Referensi

Dokumen terkait

植物の「性別」を決定する性染色体の研究が始まって以来, およそ100年もの時間が経つが,いまだにその決定遺伝子や 制御機構に関する知見は非常に限られている.ここでは,植 物では初めて性別決定遺伝子が同定されたカキ属植物におけ る研究を出発点として,進化理論的観点から見た植物の性別 決定メカニズム・性染色体の進化動態など,主に種子植物の

1, 2017 塩を噴く植物ローズグラスの耐塩性機構 塩噴き植物は塩害に強い? 土壌に過剰量の塩分(主としてナトリウム,Na)が 蓄積されると塩害(塩ストレス)が発生し,植物の生産 性が低下する.塩ストレスは世界の農耕地の植物生産を 減じる主要因となっていることから,植物の耐塩性を向 上させる試みが重要である.植物の耐塩性機構には,植

生 物 コ ー ナ ー 国立科学博物館とキノコ多様性プロジェクト はじめに キノコは菌界に属する生物であり, 植物ではない.同じく菌界に属する生 物としてはほかにカビや酵母類などが あり,キノコ類もそれらと同じく,微 生物的な生き方をする.たとえば,生 活環の大部分は,人間の目に見えない 胞子や菌糸の状態で過ごす.人間の目 に触れるのは,胞子を形成するための

2, 2016 代謝速度を考慮した戦略が必要と考えられる.ここで は,「エマルション化技術」にフォーカスし,この技術 を利用した共役脂肪酸の安定性や吸収効率の改善による バイオアベイラビリティーの向上,そして薬剤との併用 による作用増強を取り上げる. 一般的に水中に油滴粒子が安定して分散することで O/Wエマルションとなるが,粒子径が小さいマイクロ,

環境要因の保護が義務付けられていることがわかっ た。EPBC Actに基づくアセスメントは、国民、連邦の 両方の行為において義務付けられており、特に連邦の 行為においては、「国有地の環境に重大な影響を与え る行為行ってはならない」との規則もあり生態系に影 響を与える開発行為においてはアセスメントが必要 になることから、オーストラリアでのアセスメントは

費用 — 「便益」の対概念 — 逆に、ある商品を手放すのと引き換えに要求する最小金額を考える ことができる。 これを「受入補償額WTA: willingness to accept」と言う。 その商品を手放して、WTAを受け取るとき、効用は増えも減りもし ない。 対価>WTAなら売り手の効用が増す。

ローラーコースターと機構 ―より実物へ― 村松 宏祐 松本 亮平 堀越 理仁 1.はじめに はじめに,ローラーコースターを作成する に至るまでの経緯を振り返ってみる。遊園地 の乗り物を再現するに当たって,最初はメリ ーゴーラウンドを再現することを考えた。単 純な動きをいくつも組み合わせることによっ て,非常に複雑な動きを再現しているからで

HTML と XHTML  HTML HyperText Markup Language WWW サーバ上で公開される文書に用いられる標準的な マークアップ言語 • マークアップ言語 : 文書の見た目や構造などを文章とともに 記述するための言語 ハイパーリンクが使用可能 タグを用いて記述  XHTML EXtensible