• Tidak ada hasil yang ditemukan

日本語フレームネット 拡張版開発企画の紹介

N/A
N/A
Protected

Academic year: 2023

Membagikan "日本語フレームネット 拡張版開発企画の紹介"

Copied!
14
0
0

Teks penuh

(1)

日本語フレームネット 拡張版開発企画の紹介

黒田 航

kuroda@(khn.)nict.go.jp 05/10/2004

NiCT 内部向け発表

(2)

概要

• Japanese FrameNet eXtended (JFNX) の中間 目標と最終目標

• FrameNet (FN) の特徴

JFNX のロードマップ

JFNX の作業工程

既存の解析データと JFNX の関係

(3)

JFNX  の最終・中間目標

• FrameNet に緩やかに準拠した日本語のた めの意味(役割)タグつきコーパスの開発

• 日本語のための意味(役割)タグ体系の定義

• 日本語の意味(役割)タグの母体となる意味フ レームのデータベース (JFN)の開発

• 意味(役割)タグづけ支援ツールの開発

(4)

FN の特徴

• 既存の語彙解析,統語解析に依存しない

• 特定の統語解析(e.g., 構文木, 係り受け)を 仮定しない意味構造の直接記述

• 一般性,実用性への指向

• 任意の言語の任意の構文の意味構造の記述

• 意味フレームの概念に基づく(真理条件で

はなく知識構造の表現を指向した)「理解

のモデル化」

(5)

(意味)フレームとは?

• 「何が何を何のためにどうした」を表現する 状況理解の単位

• 理解の「トップダウン効果」の素になる

• 状況相対的意味役割の構造体

格フレームの発展形

• 継承などによりネットワークを形成

• 語の意義 sense を決定するのが意味フレーム

• 語義曖昧性解消問題の解決に特に有効

(6)

JFN に “X” が付く意味

• 以下の理由により BFN と慶応大学(小原代 表)の「本家」JFN との互換性は現時点では 保証されていない

• 多重コーディングが動機となって

• BFN に存在しない独自概念 (EVOKER, MARKER,  LINKER, EXTENDER) の導入

• FE の言語実現基準で無視できない違いが存在

• BFN に存在する概念 (supporters) の放棄

(7)

JFNX 符号化の実例

• 意味役割を意味タグに使用(列の順序,色には意味なし)

• フレームは名称空間 ==> 意味役割名はローカル

各種の省略に対応

!"#$%&'()*++,+-*$*+."/01'(-2*-2+(

* 34567 89 :; <=>?@6AB@7CD <=EFGH

>?@6AB@7CD

IJKL

>?@6AB@7CD MNOP QRST

>?@6AB@7CD

+ UVW 89X YZ[ \<]'^_`/^a GHb[ KLX cd[ cd[

e f gha/^a gha/^a gha/^a

, QRi 8j Y; kl'^_`/^a ^_`/^a

. m gha/^a

) nop q`_^a0`a r s

t uv :;X wx] GHX GH] MNy

- F z%0/^a

( {|} :;N'^_`/^a GH~'^_`/^a MNy'^_`/^a

+* • gha/^a

++ €•N €•N'^_`/^a GH‚ƒ MN ST‚ƒ

+e „

+, …L KL‚ƒ

+. †‡ KL†

‡'^_`/^a

+) m gha/^a

+r ˆ‰Š q`_^a0`a ‹^h&

+t Œ

(8)

意味役割の格子

f1

f4 f3

f1: 着用フレーム

f4: 出版 (<< 制作, 売る) f3: 執筆(<< 情報伝達)

a1 b1: b3: 洗剤

a1 b1 b3

f2 f2: 洗濯

f5 f5: 消費

b2: 衣類 b2

a4 a4

f6 f6: 読書

a2 a2

提供者

a5 a5

a6 a6

f7 f7: 教育

a3 a3

“Agent” Classes “Thing” Classes

洗剤

出版物 内容 執筆者

汚れ物

消費者 商品

読者 内容

作者

読者

購買者

衣服

出版者

洗濯者

着用者

商品 商品

生徒 教科書

作者 教師

消費者

読者

(9)

GOV

F8: <死亡>

F4: <病気感染>

F2: <養鶏>

養鶏家 は

インフルエンザ に

感染 した

ニワトリ を

焼き 殺し

た その

F15: <使役>

起こし手  (CAUSER)

起こされた事態 感染体

感染病

死亡体

原因 養鶏家

養殖鶏 EVO/GOV

F3: <養殖>

養殖家

養殖動物

F5: <不要物の焼却>

焼き手

焼却対象 GOV

F6: <不要物の処分>

処分者

処分対象 F9: <殺生>

殺し手

対象 GOV

手段

目的

F8: <感染病蔓延予防>

予防計画者

予防対象

意図された効果

F11, 12: <経験>

経験主体  (EXPERIENCER)

経験内容 手段

<活動>

活動主体 (AGENT)

活動内容

被影響物  (PATIENT)

F13, 14: <状態変化>

変化体 (THEME)

初期状態

結果状態 いわゆる深層格クラスの

抽象的な意味役割

処分理由

A B

A が(より抽象的な)役割 B を実現することを示す

(10)

JFNX 開発  Roadmap

• 部分コーパスに基づいて評価版の制作

当面は試験期間

来年  NLP11  までの公開を目差す

• 評価者の反応に応じて軌道修正し,規模の 拡大,注釈作業の本格化

データベースの導入

注釈ツールの開発

(11)

JFNX の作業行程

NICT コーパスから数十〜数百程度の文 {S[1], S[2], ...}  を採取し部分コーパス  T を作成

選定基準は検討中

S[i] ごとに意味フレームを網羅的に特定し,

それを人手でコーディング

JFNX Berkely FN にない多層コーディング法を採用

T に現れたすべてのフレームを規格化,デー

タベース化し,全体作業量の見積もりを得る

(12)

当面の課題

• 評価版コーディングのための部分コーパ ス  T の選定基準の明確化

JFNX  解析法の明示化,確立

• 黒田が個人的に行っているタグづけ作業の明示化か らマニュアル化が不可欠だが,これは容易ではない

• 黒田以外の人物がコーディングできるのか,実験す る必要アリ

• 可能だとして,どれほどの作業量なのか見積もる必

要アリ

(13)

既存データとの関係 1

• 当面,ほかの解析には依存しない独立のレイ ヤーに意味タグつき部分コーパスを「参考 データ」として提供

• 形態素解析,係り受け解析,格フレーム辞書 の「信頼性」の指標を提供

• 意味フレームの心理学的妥当性は部分的に検証されている

• ただし「本気で」開発すれば, JFNX 流の意

味解析は統語解析を無用にする可能性もある?

(14)

既存データとの関係 2

形態素解析 手動解析可能 互換性は期待し うる

係り受け解析 仮定せず 上位互換性は期 待しうる

格フレーム辞書 前提とせず 互換性は期待し うる

• JFNX の解析結果は,従来の諸解析結果に対し,独立の レイヤーをなし

• おそらく「監督」的役割を果たす

Referensi

Dokumen terkait

人形性愛における意識と身体の関係性 各部分は転換可能なのである。新しい性感帯 を探求するために、その顔や手足や下半身を 別の秩序に並べ替えて、ベルメールは一つの 肉体から、無限に複雑な存在の可能性を引き 出すのである。(37) 澁澤の言うように、人形をアナグラム化すると いうことは、人形の特性を利用して、身体や意識 さえも分解し再構築することである。