• Tidak ada hasil yang ditemukan

2010年度秋学期 修士論文中間発表

N/A
N/A
Protected

Academic year: 2025

Membagikan "2010年度秋学期 修士論文中間発表"

Copied!
20
0
0

Teks penuh

(1)

オブジェクトの属性を用いた適応型高速データ展開

Adaptive and Fast Data Dissemination for Structured Peer-to-Peer Overlay Network with Object Attributes

黒宮 佑介(学籍番号: 80924567 ) 政策・メディア研究科 修士課程 2 年

主査:村井 純、副査:斉藤 賢爾・中村 修・江崎 浩

2010/10/15 2010年度秋学期修士論文中間発表

1

(2)

研究概要

• P2P

の価値

専用のインフラが無くてもスケールして動作する

目的:

P2P

を利用したデータ展開の高速化

データ展開=データをネットワーク上に配信する初期段階

• P2P

が抱える問題

データ展開時の需要に対応できない

ボトルネックが発生しやすくなっている

結果として(データ展開が一段落するまでの)待ち時間が発生する

解決方法

事前に

P2P

上にキャッシュとなるノードを配置する

ノードやデータの特性を表す「属性」(例:映画・小説)をネットワーク上で共有

属性を利用することでキャッシュとして適切なノード選択を行う

期待される効果

– P2P

オーバーレイネットワークの応用範囲の拡大

– P2P

を利用する際のユーザエクスペリエンスの向上

2010/10/15 2010年度秋学期修士論文中間発表

2

(3)

データ展開時における問題点

2010/10/15 2010年度秋学期修士論文中間発表

3

ノード数

1

)データの公開

時間

タイムラグ

2

)データの発見

アップロード可能ノード数

(供給)

需要最大 ボトルネック

ダウンロード要求ノード数

(需要)

供給最大

(4)

既存のデータ展開高速化手法

• P2P を利用したデータ展開手法

– SkeedCast ( Winny ) (1) – ShareCast (2)

• 配信サーバを静的に設置して配信を行う

– P2P の価値を最大限に活かせない

配信サーバという専用のインフラを必要としている

2010/10/15 2010年度秋学期修士論文中間発表

4

ShareCast

SkeedCast

(1) SkeedCast: http://www.skeedtools.com/

(2) ShareCast: http://scast.tv/sc2plus/

配信サーバ

P2P

配信サーバ

P2P

(5)

既存手法によるデータ展開

2010/10/15 2010年度秋学期修士論文中間発表

5

1

)データの公開

タイムラグ

2

)データの発見

配信サーバ供給分

ノード数

時間

アップロード可能ノード数

(供給)

ダウンロード要求ノード数

(需要)

需要最大

(6)

本研究の提案手法

2010/10/15 2010年度秋学期修士論文中間発表

6

1

)データの公開

タイムラグ

2

)データの発見 キャッシュを作成

需要最大

アップロード可能ノード数

(供給)

ダウンロード要求ノード数

(需要)

ノード数

時間

将来ダウンロードするノードにキャッシュを作成する

=ノードの需要を満たす+供給が増える

全体として高速化
(7)

提案手法に対する要求

• キャッシュノードの動的な選択と配置

– 適切なキャッシュノードを選出する手法が必要 – キャッシュノードの条件

1.

ダウンロードを行うノードと近隣となる

2.

データのキャッシュがノードにとって有益に働く

このノードはこのデータをダウンロードするはず!

Bottleneck

Originator Originator

Data Request Nodes Data Request Nodes

Cache Nodes

動的に選択

2010/10/15 2010年度秋学期修士論文中間発表

7

(8)

ユーザの振る舞い方に着目する

• ユーザの振る舞い方に以下の特徴がある

(ユーザ=ダウンローダー・アップローダー)

1. ある分野に以前から興味を持っている 2. ある分野に含まれるデータを持っている 3. 今後もある分野に興味を持つ

• ユーザの振る舞い方をノードに反映させる

1. ノードは以前からそのデータを探している 2. ノードはそのデータをダウンロードしている 3. ノードは今後もそのデータをダウンロードする

2010/10/15 2010年度秋学期修士論文中間発表

8

(9)

• データとノードはそれぞれ(属性)タグを持つ

– データのタグ

アップロード時にユーザが指定

複数個(

10

個程度)のタグを付加する

– ノード(=ユーザ)のタグ

各ノードはタグのテーブルを持つ

ダウンロードしたデータによりタグの優先度を決定する

優先度によりノードのタグを選択(上位

N

個、閾値、

etc…

属性を用いたデータとノードの紐付け

2010/10/15 2010年度秋学期修士論文中間発表

9

データ

映画 小説

ドラマ

映画 ドラマ

ノード(ユーザ)

映画 映画

映画 小説 ドラマ 小説

ドラマ ドラマ

ダウンロードしたデータ

自動的に決定

映画 小説 ドラマ

4 1 4

(10)

P2P ネットワークの構成( 1/2 )

• 非構造化 P2P と構造化 P2P

– 非構造化 P2P (例: Winny 、 Share )

特徴:広く複製されているデータを見つけることが得意

検索:任意のキーワードで検索が可能

– 構造化 P2P (例: Chord, CAN, Pastry, Kademlia )

特徴:効率的にどんなデータでも確実に見つける

検索:(直接的には)キーによる検索しか可能ではない

• 目的: P2P を利用したデータ展開の高速化

– キャッシュをヒットしやすくする

ノードをクラスタリングする ・・・非構造化

P2P

が得意

– 基本的にどんなデータも検索可能

レアなデータも検索可能に ・・・構造化

P2P

が得意

2010/10/15 2010年度秋学期修士論文中間発表

10

(11)

P2P ネットワークの構成( 2/2 )

• 構造化 P2P に非構造化 P2P の特徴を持ち込む

– 利点:高速なデータ・ノードの発見が可能になる

データの属性にマッチするノードの発見が容易になる

– 方法: Kademlia

1

を拡張する

全体の

Kademlia

とグループ毎の

Kademlia

• Kademlia を用いる理由

– トポロジー自体が特定の構造を持たない(非構造的)

1. 経路を複数持つことが可能

複数のグループに属する場合に有効に作用する

2. ノードが頻繁に出入りする状況を想定している

冗長性を高めるためにあらゆるメッセージを活用

• Kademlia

以外の構造化

P2P

は専用のメッセージが必要

2010/10/15 2010年度秋学期修士論文中間発表

11

1Kademlia: A peer-to-peer information system based on the xor metric

P Maymounkov, D Mazieres - Peer-to-Peer Systems, 2002 - Springer

A

B C

(12)

評価指標と方針

• シミュレーションを用いて評価

規模拡張性

ノード数

データ数

タグ(属性)数

グループ内ノード数

• Kademlia

の経路

閾値

ノードあたりのタグ数

タグ選択(手法)

キャッシュ配置効果

冗長性

キャッシュ効率

ノードとデータの距離

データ展開時間

他の

DHT

との比較

2010/10/15 2010年度秋学期修士論文中間発表

12

ノード・タグの増加に対しての規模拡張性 規模に対しての可塑性・研究の有効性

最適なパラメータ・汎用的な手法の導出

キャッシュの配置が有効に作用したか

(13)

スケジュール

アルゴリズム設計

ノードタグ決定

ダウンロードしたデータからのタグ 抽出方法

タグの変更があった場合は?

ユーザからのタグ指定の受付

キャッシュノード選択

閾値の設定

ノード発見の方法

ネットワーク規模の測定方法

ネットワーク設計

想定環境

ノード数・データ数・タグ数

– Kademlia

グループ数

グループ内のノード数

ノード

経路数

データ・タグ数

• Churn

耐性

2010/10/15 2010年度秋学期修士論文中間発表

13

予定

10/

24 31 11/

7 14 21 28 12/

5 12 19 26 1/

2 9

アルゴリズム設計 ネットワーク設計 シミュレータ実装 評価(データ分析)

論文執筆

(14)

まとめ

• 目的

– P2P を利用したデータ展開の高速化

 待ち時間なしで手に入れたい!

• 手法

– P2P ネットワークをタグ毎にグループ化 – 構造化 P2P の Kademlia を拡張

• 構造化 P2P に非構造化 P2P の特徴を持ち込む

• 評価

– 複数の視点から評価

• 規模性、閾値、キャッシュを配置する効果

2010/10/15 2010年度秋学期修士論文中間発表

14

(15)

ここから非表示スライド

2010/10/15 2010年度秋学期修士論文中間発表

15

(16)

2010/10/15 2010年度秋学期修士論文中間発表

16

ノード数

1

)データの公開

時間

タイムラグ

2

)データの発見

アップロード可能ノード数

(供給)

需要最大 ボトルネック

ダウンロード要求ノード数

(需要)

供給最大 データの価値

情報価値

(17)

• ジャンル

• タイトル

• サブタイトル

• 登場人物

– ヒーロー・ヒロインなど

• テーマソング

• 制作者

• スタッフ

2010/10/15 2010年度秋学期修士論文中間発表

17

(18)

• G-Tap

– Tapestry

で構成された

DHT

に基づいて構成される

– 2

種類の経路制御方式をサポート

• Destination-Specified

• Path-Constrained

グループ化手法

• Group Membership Rendezvous

GMR

)ツリー

• Diminished Chord

– Chord

で構成された

DHT

に基づいて構成される

経路制御方式(

1

種類)

• Destination-Specified

複数のグループ化手法をサポート

ツリー型

埋め込みツリー型

スパースリング(

With/Without Prefinger

2010/10/15 2010年度秋学期修士論文中間発表

18

(19)

• HIBIKI

• Performance Analysis of DHT Algorithms for Range-Query and Multi-Attribute Resource Discovery in Grids

2010/10/15 2010年度秋学期修士論文中間発表

19

(20)

• ポイント:同じタグを持つノードが近隣になる 1. タグ毎に P2P ネットワークを形成する

– ○ P2P の構造が簡単になる

– ×リソースを多く消費する(非効率)

– ×複数タグを走査することが難しい

2. P2P ネットワークをタグ毎にグループ化

– ○リソースを有効に使用できる – ○複数タグを走査することが可能 – ×構造が複雑になる可能性がある

2010/10/15 2010年度秋学期修士論文中間発表

20

Tag A

Tag B Tag C

Tag A

Tag B Tag C

Referensi

Dokumen terkait