2010年度秋学期 修士論文中間発表
構造化 P2P オーバーレイネットワークにおける オブジェクトの属性を用いた適応型高速データ展開
政策・メディア研究科 修士課程2年 黒宮 佑介
平成22年10月23日 概要
インターネットの利用形態の多様化が進む中で,P2Pオーバーレイネットワークが活用されている.P2Pオーバーレイネットワーク では、容量や性質などが異なる様々なデータの共有を行うことが可能であり、主にデータ配信プラットフォームとして活用されるこ とが多い。しかしながら、P2Pオーバーレイネットワークにはデータ展開時の需要に対応できないといった問題があり、そのために データの転送開始までに待ち時間が発生してしまう場合がある。本研究では、このようなP2Pオーバーレイネットワークの問題点を 解決するため、インセンティブ整合的にキャッシュを配置することで負荷分散を行うアーキテクチャを提案する。また、その際、デー タとノードに対して属性を設定し、それらをネットワーク上で共有することで、高速かつ適切なノード選択を可能にする。本研究の 成果により、P2Pオーバーレイネットワークはこれまで以上にデータ配信プラットフォームとしての性能が向上するだけでなく、そ の応用範囲の拡大やユーザエクスペリエンスの向上が期待できる。
1 はじめに
近年,インターネットの利用形態の多様化が進み,新し いデータ配信方法として,Peer-to-Peerオーバーレイネッ トワーク(P2Pネットワーク)が利用されるようになって いる.P2Pネットワークには専用のインフラが必要なく、
また、要求に応じてその規模を拡大していけるという特性 がある。そのため、P2Pネットワークでは、容量や性質な どが異なる様々なデータの共有を容易に行うことが可能で あり、主にデータ配信プラットフォームとして活用されて いる。
しかしながら,P2Pネットワークにはデータを配置する 際(データ展開)の需要に対応できないといった問題があ る。これは、P2Pネットワーク上でデータ配信ノード(オ リジネータノード)が単一となってしまうためであり、急 激に増加する需要に対して、一時的に供給が追いつかなく なる場合がある。このような問題はP2Pネットワーク特有 の問題ではないが、一般的なインターネットサービスが用 いるクライアント・サーバモデルでは、あらかじめサーバ を複数用意し、分散して設置を行うことでこのような事態 を回避している。そのため、供給側(ユーザ)にサーバな どを複数設置することが難しいP2Pネットワークでは、供 給側のボトルネックのために、データの転送開始までに待 ち時間が発生してしまう場合がある。
本研究では,P2Pネットワークにおいて効率的に(ビデ オ)データ展開を行う手法を提案する.
2 P2P ネットワークの問題
本節では既存のP2Pネットワークを考察し、その問題点 について分析を行う。
現在のP2Pネットワークにおけるデータ展開例を図1(a) と図1(b)に示す。
図1(a)において、初期にオリジネータノードを発見した ノードCとDはオリジネータノードへのダウンロード要求 を行い、正常にデータ転送が行われる。一方で、図1(b)で は、ノードA、B、E、Fに関して、既にデータ転送を行って いるオリジネータノードに対して要求が行われるため、オ リジネータノードの供給能力がボトルネックとなり、デー タ転送が正常に行われない。
C D E
B F
A
䜸䝸䝆䝛䞊䝍䝜䞊䝗
୍⯡䝜䞊䝗
(a)データ展開(初期)
C D E
B F
A
䜸䝸䝆䝛䞊䝍䝜䞊䝗
୍⯡䝜䞊䝗
(b)データ展開(中期)
図1: 現在のP2Pネットワークにおけるデータ展開 そのため、P2Pネットワークのデータ展開を高速化する ためには、オリジネータノードのボトルネックを解決する 必要がある。
3 既存のデータ展開高速化手法
P2Pネットワークのデータ展開を高速化する手法として、
配信サーバを設置する手法がある。この手法では、配信サー バを利用して一次配信を行うことで、P2Pネットワークの 問題点を回避しつつ、その特性を最大限活かすことが可能 となっている。
しかしながら、配信サーバを静的に設置して配信を行う 場合には、専用のインフラが必要となるため、P2Pネット ワークの利点の一つであるインフラが不要という特性を損 なってしまう。また、P2Pネットワークでは誰もが情報の 発信者になれるため、個人レベルでの情報配信なども自由 に行うことが出来るが、配信サーバを利用するモデルでは すべての情報が配信サーバによって管理されるため、P2P ネットワークの情報配信プラットフォームとしての特性も 大きく損なわれてしまう。
本研究では、P2Pネットワーク本来の特性を損なうこと なく、データ展開を高速化するための手法を提案する。
4 キャッシュノードを用いた高速データ 展開
4.1 概要
本研究ではデータ展開を高速化するために、キャッシュ ノードを用いる。図2(a)と図2(b)に本研究の提案手法を 示す。
1/2
䜻䝱䝑䝅䝳䝜䞊䝗
୍⯡䝜䞊䝗
C D E
B F
A
䜸䝸䝆䝛䞊䝍䝜䞊䝗
X Y Z
(a)提案するデータ展開手法(初期)
䜻䝱䝑䝅䝳䝜䞊䝗
୍⯡䝜䞊䝗
C D E
B F
A
䜸䝸䝆䝛䞊䝍䝜䞊䝗
X Y Z
(b)提案するデータ展開手法(中期)
図2:提案手法によるP2Pネットワークにおけるデータ展開 本提案手法では、まず最初に一般ノードの中からキャッ シュノードとして適切なノードを複数選択する。具体的な キャッシュノード数はネットワークの規模によって決定され る。図2(a)では、一般ノードの中からX、Y、Zという3 つのノードが選択され、オリジネータノードがデータを公 開する前にデータ転送を行い、キャッシュノードとなってい る。本提案手法ではあらかじめキャッシュノードを作成す るため、データの公開は一時的に遅れることになるが、全 体として見た場合には一次配信が高速に行われるため、結 果として高速な配信が可能となる。
そして、オリジネータノードがデータを公開すると同時 にキャッシュノードもデータを公開し、それぞれ広告を行 う。図2(b)では、キャッシュノードX、Y、Zにそれぞれい くつかのダウンロード要求が来ており、並行してP2Pネッ トワークを利用したデータ展開が行われている。
このように、本手法では配信サーバの代わりにキャッシュ ノードを設置することで、既存のP2Pネットワークの特性 を損なうことのないデータ展開を可能にする。
4.2 キャッシュノードの条件
本提案手法では、適切なキャッシュノードの選択が必要 となるため、キャッシュノードの条件を以下のように設定 している。
• ダウンロードを行うノードと近隣となる
• キャッシュするデータを将来ダウンロードする
=キャッシュノードになることが不利にならない
4.3 キャッシュノードの選択
4.3.1 ユーザの振る舞い方の特徴
本提案手法では、キャッシュノードを選択する際にデー タとノードのマッチングを行うことで、適切なノード選択 を行う。その前提として、ユーザの振る舞いに関して以下 の3つの特徴があると考えている
1. ある分野に以前から興味を持っている 2. ある分野に含まれるデータを持っている 3. 今後もある分野に興味を持つ
本研究ではこのようなユーザの振る舞いをノードに反映 させることで、データとノードのマッチングを可能にする。
4.3.2 データとノードの紐付け
本提案手法では、データとノードのマッチングを行う際 に、それぞれの属性を利用する。具体的にはデータとノー ドのそれぞれにタグを設定することで、データとノードの 紐付けを行う。図3に概要を示す。
䝕䞊䝍
ᨷẆᶵື㝲 ኈ㑻ṇ᐀
䜰䝙䝯
ᨷẆᶵື㝲 䜰䝙䝯
䝜䞊䝗
ᨷᶵ ᨷᶵ
ᨷᶵ ኈ㑻 䜰䝙䝯 ኈ㑻
䜰䝙䝯 䜰䝙䝯
䝎䜴䞁䝻䞊䝗䛧䛯䝕䞊䝍
⮬ືⓗ䛻Ỵᐃ
図 3: データとノードの属性の関係
5 P2P ネットワークの構成
本研究の目的はP2Pを利用したデータ展開の高速化であ る。そのため、ノードをクラスタリングしてキャッシュを ヒットしやすくする非構造化P2Pの仕組みと、稀少なデー タを効率的に検索可能にする構造化P2Pの仕組みの両方が 必要となる。
そこで、本研究では構造化P2Pに非構造化P2Pの特徴 を持ち込む手法として、構造化P2PであるKademlia[1]を グループ化する拡張を行う。
Kademliaを用いる理由は以下の3つである。
1. トポロジー自体が特定の構造を持たない 2. 経路を複数持つことが可能
3. ノードが頻繁に出入りする状況を想定している 特に、1つ目の特徴により、Kademliaは、P2Pネット ワークの構成を適応的に行うことが可能である。そのため、
非構造化P2Pで用いられる手法である、自分と興味分野が 似ているノードを近隣に寄せることが可能であり、本研究 に必要な要件を備えていると言える。
6 評価指標と方針
本研究の評価は、シミュレーションを用いることで、以 下の項目について行う予定である。
• P2Pネットワーク
Kademliaを拡張したP2Pネットワークの規模拡張性 やChurn耐性について評価を行う。
• キャッシュの効果
キャッシュを事前に配置することで、待ち時間が減少 したのかを評価する。また、キャッシュがローカルに ある確率も評価することで、究極の高速化実現可能性 についても検討を行う。
7 まとめ
本研究ではP2Pを利用したデータ展開の高速化のため に、構造化P2PネットワークであるKademliaにグループ 化の拡張を行う。そして、設計したP2Pネットワークの性 能とキャッシュの配置効果の評価を行う。
本研究の成果により、P2Pネットワークはこれまで以上 にデータ配信プラットフォームとしての性能が向上するだ けでなく、その応用範囲の拡大やユーザエクスペリエンス の向上が期待できる。
参考文献
[1] P. Maymounkov and D. Mazieres. Kademlia: A peer-to- peer information system based on the xor metric. Peer-to- Peer Systems, pages 53–65, 2002.
2/2