• Tidak ada hasil yang ditemukan

maruchimedia tekisuto no kozoka to sono oyo ni kansuru kenkyu

N/A
N/A
Protected

Academic year: 2021

Membagikan "maruchimedia tekisuto no kozoka to sono oyo ni kansuru kenkyu"

Copied!
82
0
0

Teks penuh

(1)

l,l・稲田大学審査学位論文(溥士)

(2)
(3)
(4)
(5)
(6)

第1章序論 2

コンテンツの作成者の意図が受信側に明確に伝わるよう忠実にデータを伝送・再生し,コンテンツの 再構成,再利用が行えるよう,マルチメディア情報に論理的な構造化をとりいれる概念である.具体 的には,I哨報を,まず1.内容情報(Essence)と2,表現情報(Representatian)の2つに分類し,内容

情報として,コンテントポーションデータぐContent PQrtion Data),表現情報として論理構造データ (Logical Strudure Data),レイアウト構造データ(Layout Structure Data),の合計3種類のデータに

よって表現するものである.この概念を勧画像データに当てはめたものとして,VDA(video Document Architecture)f9]があり,編集や検索等の再利用性を目的とした動画像データのアーキテクチャにつ

いての検討がなされている.このような動画像データの構造化を符号化に応用したものとして,オブ

ジェクト'`゛−ス分析合成符号化(OBASC:Ob.ject Based Analysis-Synthesis Coding)【10】[11]がある. 0RASCでは,画像中の論理構造をオブジェクトと背景に分割し,そのうちのオブジェクトを動き,形 状,テクスチャの各要素に構造化することによって,人間のオブジェクト理解に近い手法によって画 像の符り一化を行う手法である.こうしたオブジェクトベースの概念は,標準方式として規格化されつ っあるMPEG4に採り入れられているが,まだ研究の途上にある【4】.  これまで述べてきたデータ記述方式の確立,高性能CPUを搭載したPCを始めとする情報処理端 末,スキャナ,ディジタルスチル・ピデオカメラ,プリンタ等の入出力装置,高容量デイスクアレイ, DVDなどの蓄積装置等のハードウェア,更にはこれらのデータを伝送するISDN,インターネット, ディジタル放送等の伝送方式の開発と普及によって,数年前とは比較にならない程の数多くのマルチ メディアデータに,どこからでもアクセスできる環境が整備された.  しかし,現状では,これらのディジタルデータと人間との間に,人間にとってデータの中身の理解 を助けるインターフェース環境が十分に整っていないため,大容量データを目の前にして,本当に必 要な↑Iリ眼を検索,アクセスすることができない状況に陥っている.また,ディジタルデータは容易に 完令な複製,または部分的な引用が可能であり,コンテンツの制作者の著作権を安全に保護する仕組 みも│一分に整備されていないため,不正に数多くのコピーが出回っている状態になっている.  こうした観点からは,水割こ使いやすいマルチメディア通信環境が整備されているとは言い難く,人 間の理解を助けるエキスパートシステム的な機能も合めた形で,マルチメディア通信環境の整備を行 う必要がある[12].こうした背景に基づき,本論文では静止画像,オーディオ信号,動画像等の各種マ ルチメディアデータを,単なる記号の系列ではなく,究極的にはデータを取り扱う人間に理解のしや すい,使いやすい形式,つまり広義の「テキスト」という形式で記述することを目指す.そして,その ような形式で記述されたマルチメディアデータの表現形態をマルチメディアテキスト(Multimedia Text)と名付ける.各種コンテンツをそれぞれの利用目的に応じた形で論理的な構造化を施したマル チメディアテキストで記述することが本論文における主題である.  また.本論文での研究成果は,筆者が1994年の早稲田大学大学院博士後期課程に進学後,博士課程 の学生として在籍中の3年間,及び1997年∼1999年に通イ言・放送機構早稲田リサーチセンターにお いて,情報冷蔵庫プロジェクトの研究員として在職中の3年間,計6年間に行った成果をまとめたも のである. 1.2 研究の目的  将来のマルチメディア情報化時代に適した情報配送インフラストラクチャとして,情報冷蔵庫シス テム[13]についての研究がなされている.情報冷蔵庫の基本構成図(小管らによる[13])を図1.1に示 す.情報冷蔵庫は,情報提供センタ(I 「ormation Provider),ユーザ装置(User Equipment),両者を 結ぶ惜報配送網(Content DistributionNetwork),制御・課金情報網(Control/Paymeng Network)と から構成されている.情報冷蔵庫のユーザ装置内の各機能についての説明図(小管らによる【13Dを図 1.2に示す.情報冷蔵庫は,センタエンド型情報提供システムにおける情報配送の効率化と,配送され た情報を利用者の独白の要求に沿って編集加工する手段の提供と,利用した情報のみに対して課金す る手段の提供を目指すものであり,情報冷蔵庫におけるコンテンツのデータ構造としては,前述した ドキュメント・アーキテクチャの概念に従って論理的なフレームワークで記述されたものであることが 第丿章序論 3 前提となっている.また,コンテンツの取り扱いにおいては,正しい課金を行う仕組みはもちろんの こと,コンテンツの編集・加工時に発生する原著作者の著作権を確認・保護する仕組みは必要不可欠 となる.本論文では,対象コンテンツを適当な手法によって「テキスト化」し,その情報冷蔵庫シス テムにおける利用を想定して構造化することを目的とし,具体的には以下に記す5つの項目について 検討を行った成果をまとめている.以下,各項目における背景と検討項目について筒単に説明する.        Conterlt DistfibutiGn Networkl lnformatjon  Provider  Center C(珀砥)か?∂μ7×977f    Network 図1.1:情報冷蔵庫の基本構成 1.2.1 指紋画像の構造化  ネットワークアクセスやICカード利用時等において,本人を正しく確認する機能は必要不可欠であ る.これまで,パスワードや暗証番号といったものが本人確認の鍵として用いられてきたが,人間の 記憶に頼るといった点,なりすましの容易性において,十分な安全性は保証されているとは旨えない. これに対して,指紋・音声・網膜・掌紋といった個人に特有な身体的特徴を鍵とする手法は,安全性の 点で優れており,数多くの研究及び実用システムの開発が行われている.中でも,指紋は,「万人不同」 「終生不変」の個人の身体的特徴であるとされ,古くから犯罪捜査等の分野において本人同定の有力な 証拠として用いられてきていることは周知の事柄であるが,プライバシーに関する抵抗が大きく,気 軽に本人を確認する方式として,昨今は,顔を用いた方式が注目を浴びている.日常的に,我々も他 人を識別する際には,顔によって識別している場合が多く,こういった非接触型の方式は,実用化さ れた際にも大きな違和感なく受け入れられることが予想される.しかし,時期的変動や双子によるな り済ましの問題が存在し,これに対して時間軸に動き情報を付加したボディーラングージをパスワー ドとして用いる方法も提案されている[14]が,そのためには現状においても大がかりなシステムが必 要となる.今後,本人間定の問題は,インターネットにおいて現在見られているように,ネットワー クの高機能化や,ワイアレスアクセスによる稼動通信環境の整備と交通機関の進歩に伴って人間のモ ビリティが増すにつれて,身体的特徴によるより安全性の高い本人照合技術と,システムの簡易性が 求められる.以上のような観点から,簡易型で十分に本人間定を行うための手法としては,指紋によ る方式は極めて現実的であると考えられる[15].そこで,本論文では,簡易型本人照合システムのた めの,指紋画像情報表現法について検討する.

(7)

第7章序論 ContentDi・stribut沁n Netwo戊 1……'‘""'¨'………1 11ndex jnformabcn l Corfrひ1ZPaymenUvelwo蹟 − − ・ - - 6 . - │ ミ ` 匹 − − . 9 ・ ● ● = │ ■ 一 齢 ・ F ¨ ¨ ¨ ¨ η Content J 図1.2:情報冷蔵庫のユーザ装置内の各機能 4 1.2.2 文字情報の構造化  画像中の2次フuオブジェクトの特徴表現形式のうち,主な方法としては,エッジ抽出により境界線 構造を表現するもの[16]や,細線化等の処理によって,骨格構造を抽出して表現するもの[17]がある. どちらの方法を用いる場合も,記述された特微量を用いてオブジェクトの認識処理を行う際の問題点 の1つに,入力オブジェクトのサイズの違いや回転といった入力誤差の克服処理がある.こうした問 題に対して,一般的には,画像ベースでの特徴データの正規化処理が必要であり,前処理として多く の作業を必要とする場合が多い.  更に,文字のように,例え2値画像ではあっても,多種多様なフォント(字体),更には手書き文 字までが含まれる2次元オブジェクトを認識処理の対象とした場合,同一文字であっても広範囲な特 徴量の分布が得られ.このことが文字認識技術を困難な課題にしている1181.そこで,本論文では,2 値化された文字図形に対して,その「字形情報」は境界線の形状に十分に反映されているという仮定 に基づいて,境界線の構造をオブジェクトに輪ゴムをひっかけた時に得られる形状情報と画素の反転 処理の反復によって得られる情報によって記述していく方法を提案すると共に,抽出された文字の特 徴情報を認識処理に利用する手法について検討する. 1.2.3 音声の構造化・符号化方式  楽器の知識がある人は,演奏される音階とその楽器が分かれば,既知の楽器については,その楽音 を想像することができるし,オーケストラのように複数の楽器によって作り上げられた音楽からも, 第丿章序論 5 特定の楽器の奏でる音を分雄一識別することができる.また,主に人の会話を対象とした音声情報は, 話者の持つ特徴と発話内容とに情報の意味を分類できる.この2種類の情報の分類・認識する技術が, 話者認識であり,音声認識である.サウンドの対象をオーディオ信号(楽曲等)とした場合,話者認 識が楽器認識に,音声認識が音階認識に該当する.この音階情報と楽器情報とを抽出し,どの楽器が どのようなテンポでどのような音階の音を奏でているのかを記述することができれば,人間による楽 音の理解に極めて近い信号の記述が可能となり,オーディオ信号の検索,再利用がより容易になるも のと思われる.既に電子音楽機器には,MIDI規格が存在し,Mmlで音楽信号を記述したMエDIファ イルでデータのやりとりがなされているが,類似した規格を従来のクラシック用の楽器に対しても適 用することは,極低ビットレートでのオーディオ信号符号化に十分利用できると考えられる.  また,近年,急速に普及しつつある自動車電話や携帯電話のみならず,将来実現が期待される高品質 移動体マルチメディア通信において,音声のみならず,音楽信号も対象とした高能率オーディオ符号化 技術がますます重要なものになりつつある[19]【20】.高能率オーディオ符号化方式のアプリケーション は,移動体マルチメディア通信の他,INTERNETを介したラジオ番組の放送,Audio。n Demand な ども挙げられ,ユーザの使用する環境(ISDN,アナログ電話回線十モデム)によって異なる伝送速度に 対処する・^゛く,従来のMPEG符号化においても,異なる伝送速度の標準化がなされている【21】. この ように,高能率オーディオ符号化とは,単に低伝送レート,つまり高圧縮を実現するだけでなく,ユー ザにとって使い易い付加的な機能を備えたものが望まれる.  それらは,例えば,聴力障害者の人々の利用が見込まれる再生時のスピードコントロール,ピッチ コントロール,ビットレート/品質スケーラビリティ【21】であり,現在,この分野の国際標準化作業を 推し進めているISO/IEC JTC1 SC29/WG11(MPEG-4研究グループ)においても,これらの機能を サポートするものが求められており122]【231,具体的には,その極低ビットレート符号化方式のター ゲットは,伝送レート61≒s∼16X勿』である.  本論文では,これらの2つの背景のもと,6ゐ6psを一応の伝送レートの目標として,これまで音情 報処理の分野において検討されてきた音源分離,基本周波数抽出.音合成等の技術124]を導入してサ ウンド信号の分析/合成符号化の一手法について,基礎的な検討を行なった結果について記す. 1.2.4 構造化された画像と音声データの協調処理について  動画像をドキュメントアーキテクチャの概念に基づいて構造化し,意味のあるコンテンツごとに分 割,符号化に応用する研究が進められている19].これらが実現すると柔軟な画像の検索や,一般ユー ザレベルでも容易に編集等の再加工が行える環境が整備される.しかし,一般に映像だけのコンテン ツは少なく,映像と音声情報が何らかの関係を持って同時に記述・再生されて価値を持つものがほとん どである.特に映画やアニメーションなどではセリフや効果音が大きな情報量を持っているため,編 集・加工を行う場合は付随する音声情報を無視することはできない.ところが,これまでは画像と音声 はそれぞれ個別に符号化され,物理的な同期を編集後に改めてとる作業が必要であった.しかし,ビ デオカメラ等の高性能なマルチメディア情報の入力端末が一般家庭にも普及し始めている現在,相互 に関連するマルチメディアデータを統合的に扱う枠組みが必要であると考えられる.複数のメディア 情報を同時に記述,またそれらの相関関係を記述することによって,以下のような効果が期待できる と考えられる.  ・編集・加工がしやすい環境の提供    一方の情報を編集すると,関連する他の情報が編集内容に応じて自動的に編集される.  ・圧縮符号化への応用    第4章において示すように,音声情報を楽譜情報(テキスト)の記述量の少ないメディア情報に    置き換え記述,再現できるようにすることで,情報量の圧縮が行える.  ・精度の高い情報の抽出    例えば,ノイズの多い環境下において複数の入力系統を用意し,環境に応じてより信頼性の高い    手段による情報を優先,または相関関係を利用して,情報の訂正,補間を行うことができる.

(8)

第丿章序論 6 こうした観点から,本論文では音声情報と画像情報との相関を利用した協調処理について検討した結 采を報告する.具体的な検討項目としては,1.編集加工を目的とした音声情報と画像情報の統合とそ の応用に関する検討,2.音声・画像情報の統合による音階情報抽出に関する検討の2点としている. 1.2.5 動画像の構造化とその情報セキュリティヘの応用  インターネットの急速な普及によって,ネットワーク上での動画像データのやりとりがますます盛 んになってきている.既に実用化されているビデオストリーミング技術に加え,DVD,IEEE1394イ ンタフェースを持つビデオ機器の普及やディジタル放送の開始に伴って,ディジタル動画像コンテン ツの流通量は,今後爆発的に増加するであろう.ところが,ディジタル情報が有しているコピーや編 集が容易に,しかも品質を劣化させることなく行える長所は,同時に不正コピーによって著作権が侵 害される状況を招き,反ってコンテンツの自由な流通を妨げることにつながる短所ともなりえるため, 習作権を保護する仕組みが益々重要になってきている.一般にデータ保諏には暗号が用いられてきた が,│】μ;・化することによって圧縮効果が薄れてしまったり,扱いが面倒になるといった問題がある他, 1対多の通信においては,適当な方法だとは言えない.   一方,人m」の視覚・聴覚にうったえるマルチメディア情報については,情報冷蔵庫構想においても, I」司に配布されたコンテンツの購入をユーザが検討する場合に,その内容を知っておきたいという要 求など,マルチメディア情報をより扱いやすくしたいというユーザの要求の多様化があげられる.そ こで,コンテンツ内容を主観的に劣化させない(知覚できない範囲において劣化させ)程度に各種マル チjディアコンテンツに著作権情報を埋め込む電子透かL技術[25]が注目されている.電子透かし技 柘において.埋め込む情報はヘッダ部分等の新たな情報書き込み領域にではなく,コンテンツの内容 自体に;'Fき込まれる.つまり,データの多重化がなされて原データが改変されるため,コンテンツ内 容の主情報が劣化しているか否かの判定は人間の主観による視覚・聴覚的な判断に委ねられる.それ II&,;'11]'・透かしを施す際には,対象マルチメディアコンテンツ内(主情報)の各情報の構造化を行い, 視覚・聴覚的な重要性のjlla位の低いものを埋め込み対象領域として考慮していく必要がある.  こうした考えのもとに,本論文では動画像コンテンツを対象として,その構造化の仕組みに従って, 電子透かしを埋め込む手法について検討を行うこととする. I.2.6 電子透かしを応用した動画像の編集検知システム  .IPEG,MPEGに代表される高品質画像圧縮符号化方式,ディジタルカメラに代表される画像の入 出力機器,PC用高品質画像処理ソフトウェア,さらには,インターネットの急速な普及によって,一 般ユーザにとっても高品質ビデオコンテンツを入手することが容易になると共に,著作権上コンテン ツ操作を行う権利のない者も,蓄積されたビデオコンテンツを編集L,再流通させることが十分に可 能となった.一方,テレビ放送のディジタル化に伴って,より効率的な周波数資源の利用が可能とな り,多チャンネル化が進行している.その結果,十分高品質なコンテンツ量の絶対的な不足がコンテ ンツ制作者,番組提供者にとっては大きな問題になりつつある.こうした背景のもと,著作権をより 安全に保護する仕組みと共に,配信されたコンテンツの正当性を確認する仕組みがますます求められ ている.  コンテンツの正当性を確認する1つの方法として,コンテンツに書籍におけるISSN/ISBN番号に 相当する番号を付与し,著作権と共に登録するコンテンツ晋録センターを設ける仕組みが考えられて いる.この仕組みにおいては,コンテンツは配但前にセンターに登録され,ID情報を署名情報として 電子透かしによって埋め込まれる.そして,署名情報が,コンテンツの正当性を証明する証拠として 用いられる.電子透かしについては,これまで多くの方式が提案されている[25].それらは主に透か しの埋め込み,及び復号方式,種々の透かしを消去しようとする攻撃に対する耐性と画質との観点か ら論じられたもので,具体的にどの情報を署名情報として埋め込むのかといった議論は十分なされて いない.一般に考えられているように,例えば著作権者の氏名,所属,タイトル等のテキストペース の著作権情報を署名情報とする場合,著作者の情報が無事に確認できたとしても,署名情報には,コ 第丿章序論 − ンテンツの特徴情報が含まれていないため,流通コンテンツが不正に編集されたものかどうかを確認 することはできない.  実際,配信されたコンテンツが不正に編集されたものでないことを確認するためには,登録された オリジナルと配信されたコンテンツとの照合処理が必要になるが,配信コンテンツの正当性が100%正 しいものであることを確認するためにはフレーム,または画素単位で照合がなされる必要がある.但 し,動丿像データの照合処理には,非常に多くの手間がかかるため,ダイジェストを定義し,あらか じめ登録したコンテンツのダイジェストと,放送映像から抽出したダイジェストとの一致確認を行う ことで処理の効率化を実現しようとする試みもなされている[26].以上の観点から,本論文では電子 透かしの技術を利用したコンテンツの正当性を確認するシステムについて,検討を行うこととする. 1.3

本論文の構成と概要

 まず第1章は,「序論」であり,研究背景,研究目的について説明すると共に,論文構成と各章の位 置づけについて記している.  第2章「指紋画像の構造化記述法」においては,有力なアクセス制御方式となる身体的特徴による 本人確認方式の中で,特に指紋を用いたシステムについて認証方式並びにデータベース構築の観点か ら検討した結果をまとめている.本論文における成果は,従来富永研究室内において,植里氏(1991 年修士課程卒),山田氏(1993年博士課程卒)によって検討されてきた成果及び筆者の修士課程におけ ゐを成果を発展させる形で,1994年から1997年にかけて行われたものである.指紋は,万人不同の 個人の身体的特徴であり,古くから犯罪捜査等の分野において本人同定の有力な証拠として用いられ てきており,その安定した個人性,及びデータ処理の簡易性で今後も更なる実用化が期待される.本 論文では,指紋芯線画像処理を照合と画像符号化の観点から論じる.まず,隆雄を単位として隆雄の レイアウト情報と形状情報とによって構造的に記述する手法を提案する.また,位置ずれ,かすれ等 の入力誤差に対応するために隆線形状をウェーブレット極値によって表現することにする.提案方式 は,特徴記述パラメータによる画像の再構成が可能であり,また,シミュレーションによる部分照合 実験を行った結果,直線の形状特徴が抽出パラメータに反映されており,本方式の基本的な照合性能 を確認している.  第3章「文字画像の構造化記述法」においては,画像中の2次元オブジェクトの特徴を抽出・記述 する新たな方法として,境界線情報に着目し,視覚的な凹凸情報を抽出してオブジェクト形状を段階 的に表現する手法について記している.この章において述べられている内容は,1997年から1999年 にかけて,通信・放送機構早稲田リサーチセンターにおいて,第2章における指紋画像についての検 討結果に基づき,文字画像を構造化し特徴記述するべく朱青研究員との共同研究として行われたもの で,そのうち,筆者によって提案,システム設計された文字画像の構造化記述手法及び認識への応用実 験の範囲内の内容を記したものである.提案手法においては,概念的にオブジェクトに輪ゴムをかけ, 輪ゴムとオブジェクトとの接触/非接触関係を記述する.これに画像の反転処理を加えた一連の操作を 反復するという比較的単純な操作によって,オブジェクトを形成する全輪郭線特徴の抽出を行う.ま た,本手法の文字認識処理への応用手順について検討し,オフラインの印刷数字を対象としたシミュ レーション実験を行った.提案手法によって構造解析・特徴抽出処理を行い,その結果に基づいて認 識処理を行った結果,モルフォロジーを用いた従来手法と比較して,認識率において53%,処理時間 においては98%の大幅な改善がなされ,提案手法の有効性を確認している.  第4章「オーディオデータの構造化記述法」では,オーディオ信号の構造化記述法を提案し,その 応用として,MPEG-4において検討されている低ビットレートオーディオ符号化のー一手法の提案を 行っている.この章において述べられている内容は,筆者が1994年10月∼1995年10月の約1年間に

渡って,DAAD(ドイツ学術交流会:Deutsche Akademisehe Austauschdienst)の招致研究員としてドイ ツ連邦共和国ハノーバー大学(Universitiit Hannover)理論通信工学研究所(lnstitut farTheoretische Nachrichtentechnik und

(9)

第丿章序論 8

いて.Dipl.-lng. Holger Hesse氏(当時,ハノーバー大学学生)との共同研究テーマとして行われた研 究成果である.提案する方式は,入力信号において最も顕著だと推定される音(基本周波数)の推定を 行ない,求めた基本周波数と倍音の振幅値を符号化パラメータとする方式であり,分析結果をフィー ドバックして,更に分析を行う分析・合成手法に基づいている.基本周波数の抽出には定Q変換を用 い,振幅侠の近似にはフーリエ級数を利用し,モノラルの入力僧号を6Mj,』程度のレートで符号化を 実現する符号化器の設31・を行なった.シミュレーション実験の結果,単独の楽器によって演奏された オーディオ信号は,おおむね41ゐp。程度のビットレートで符号化することに成功し,再生音質の主観 評価においても満足できる品質に到達し,提案手法の基本的な有効性を確認している.  第5窄「構造化された画像と音声データの協調処理」では,1996年4月∼1997年8月にかけて,当

時早稲EI」大学大学院修士課程に在籍していたWangsiripitak Somkiat 氏,堂免大里氏,斎藤潤子氏の 協力を得て行われた研究成果について記している.本章では,従来のように,マルチメディアデータ を各メディア単位に記述し,時間情報によって同期をとって再生する方法ではなく,記述時に複数メ テ・ィアにおいて処理された結果を統合,また再生時に主となるメディアにおいて記述された情報を基 に副メディア情服の再生を行う方法について検討した結果を記している.また,ピアノの演奏を題材 に,これを鍵盤ヒに,没置したビデオカメラからの画像と,マイクによって録音した音声の2つのメディ ア」│・Ili眼の協調処理によって採譜を行う手法を提案している.提案手法によって,第4章において検討 した音声情報のみによる処理結果が改善され,マルチメディアデータの協調処理を行うことの有効性 を知認している.  第ぴ帽 ̄動II剛架の構造化に基づく電子透かし方式」では,1996年10月∼1998年3月にかけて,当 llnl・稲│]]大学珂.工学部に在籍していた中沢英徳氏,同大学院修士課程に在籍していた堂免大規氏の協 力を得て行われた研究成果について記している.本章においては,動画像情報の構造化の結果に基づ き,本質的内容にかかわらない部分に副情報として著作権情報等を埋め込む電子透かしの技術につい て検,はした結果を報告している.具体的にはMPEGビデオを対象として,その動ベクトル情報を用 いることによって副情報の埋め込みを行う手法を提案し,検討を行った結果を報告している.MPEG において,勧ベクトルは半画素単位の算出を行っていることに着目してここに副情報の埋め込みを行 う.ただ,提案する副情報の埋め込み法(探索範囲限定法)は,符号化,復号を繰り返す単純なMPEG 再圧縮操作によって副情報が消去されてしまうという欠点があるため,この再圧縮操作に対して検討 L,手法の改=6を行った結果を示している.  第7章「励画像の構造化に基づく編集検知システム」では,1998年4月∼現在に至るまでに,前章 において述べられた研究成果を発展させる形で,早稲田大学大学院修士課程に在籍中の竹内一樹氏の 協力を得て行われた研究成果について記している.本章では,不正に編集されたピデオコンテンツの 検出を目的とLたディジタル透かしによるビデオ編集検出システムを提案する.提案手法はメッセー ジの正当性を証明するディジタル署名の概念に基づいており,提案システムにおいては,ディジタル署 名のダイジェストに相当するものとして,ピデオコンテンッの特徴を記述した固紋情報を用いる.固 紋は電子透かし技術によってコンテンツに付加される.編集の検出,またはコンテンツの正当性の確 認は,埋め込まれた画紋と手元にあるコンテンツから抽出した固紋情報との一致確認作業によってな される.また,従来の電子透かし手法を,改良して新たに縮小画像を作成してそのDCT係数値に電 子透かしを埋.め込む方式を提案する.シミュレーション実験の結果,従来方式において耐性が確保さ れていなかった実用域でのMPEG再圧縮(4[MbpsD及び,電子透かしのベンチマークテストである StirMark攻撃に対する耐性の向上が確認され,提案手法の基本的な有効性が示されている.  第8章は,「結論」であり,本論文で検討した内容を総括している.  また,各章で扱う研究課題と本論文により示される研究成果及び研究経緯を表1.1に,本論文にお ける各章の位置づけを図1.3に示す. 第7章序論 表1.1:本論文の研究課題及び研究経緯 9 本論文 研究目的 マルチメディアテキストの情造化とその応用に関する研究 研究課題 構造化方式の研究と応用 構造化方式の応用 2値指紋画 像の構造化 記述法 2値文字画 像の構造化 記述法 モノラルオ ーディオ信 号の構造化 記述法 マルチメデ ィア人力に よるピアノ 演奏からの テキストデ ータの生成 勤画像の視 覚的冗長成 分のセキュ リティヘの 応用方式 動肖像の内 容情報と視 覚的冗長成 分のセキュ リティヘの 応用方式 本論文で対 応する章 2章 3章 4章 5章 6章 7章 本論文の 成果 指紋画像デ ータの論理 的構造化 1.文字画像 データの論 理的構造化 2.構造化デ ータを応用 した文字認 識システム の提案 1,オーディ オデータの 論理的構造 化 2.構造化デ ータを応用 した低ビッ トレート符 号化システ ムの提案 1.ピアノ演 奏を題材と した音声と 画像の統合 処理による 採譜システ ムの提案 2.提案シス テムの低ビ ットレート 符号化シス テムヘの応 用 1.動画像の 構造化によ る電子透か し埋め込み 方式の提案 2.提案シス テムの再圧 縮耐性向上 のための改 良 1.動画像の 構造化によ る画像の特 徴データの 電子透かし 埋め込みに よる編集検 知方式の提 案 2.提案方 式の再圧縮 耐性,Stir, Mark攻撃 への耐性向 ヒのための 改良 研究期間 1994∼1996年 1997∼1999年 1994∼1995年 1996∼1997年 1996∼1997年 L998∼1999年 共同研究者 山田道夫氏 朱青氏 朱青氏 B.Edler氏 H.Hesse氏 W.Somkiat 氏 堂免大規氏 斎藤潤子氏 中沢美徳氏 堂免大規氏 横井摩優氏 竹内一樹氏

(10)

第丿章序論

Multimedia Text 自≒U昌江恋n犀訟ゃ昌硲白

Application 10

第2

4 ︲ 才 ︲ ’ - て ` 7 -_ 早 ・

旨紋画像の構造化記述法

2.1 はじめに  ネットワークアクセスやICカード利用時等において,本人を正しく確認する機能は必要不可欠であ る.これまで,パスワードや暗証番号といったものが本人確認の鍵として用いられてきたが,人間の 記憶に頼るといった点,なりすましの容易性において,十分な安全性は保証されているとは言えない. これに対して,指紋・音声・網膜・掌紋といった個人に特有な身体的特徴を鍵とする手法は,安全性 の点で優れており,数多くの研究及び実用システムの開発が行われている.中でも,指紋は,「万人不 同」「終生不変」の個人の身体的特徴であるとされ,古くから犯罪捜査等の分野において本人同定の有 力な証拠として用いられてきていることは周知の事柄であるが,プライバシーに関する抵抗が大きく, 気軽に本人を確認する方式として,昨今は,顔を用いた方式が注目を浴びている.日常的に,我々も 他人を識別する際には,顔によって識別している場合が多く,こういった非接触型の方式は,実用化 された際にもさほど違和感はなく受け入れられることが予想される.しかし,時期的変動や双子によ るなり済ましの問題が存在し,これに対して時間軸に動き情報を付加したボディーラングージをパス ワードとして用いる方法も提案されている[14]が,そのためには現状においても大がかりなシステム が必要となる.今後,本人間定の問題は,インターネットに見られるように,ネットワークの高機能 化や,ワイアレスアクセスによる8動通信環境の整備と交通機関の進歩に伴って人間のモビリティが 増すにつれて,身体的特徴によるより安全性の高い本人照合技術と,システムの簡易性が求められる. 以上のような観点から,簡易型で十分に本人「司定を行うための手法としては,指紋による方式が極め て現実的[15]であると考えられる.  本論文では,簡易型本人照合システムを実現するための,指紋画像情報表現法について検討した結 果を記す. 2.2 システム設計 2.2.1 簡易型本人照合システム  現在,クレジットカード使用時に行われている手書きによる署名と本人によって自ら書かれた署名 との照合によってなされている本人間定を指紋を利用して行うことを考える.  インターネットやファックス回線を用いたオンラインショッピングにおいては,クレジットカード番 号のみにおいて,本人確認・課金がなされることがあり,十分な本人認証が行われているとは言えな い.そこで,クレジットカードにICチップを埋め込んだスマートカード(通称ICカード)に本人確認 のためのデータを記録する.  簡易型本人照合システムとして,圧縮された個人の身体的特徴を記録したICカードを用いた図2.1 のようなシステムを想定する.本人照合システムは,次のような手順で動作する. 11 1 1 1− 一 一 - ̄ 1   1   1 _l Raw Data Feature Description

日]匹

図1.3:本論文における各章の位置づけ

(11)

第2章指紋画像の構造化記述法 12 1. 1C カード保持者(本人)は,本人確認のためのID情報が格納されているICカードと,本人の  ID情報をシステムに入力する. 2.システムは,入力された情報を解析し,ID情報を抽出する. 3.抽出ID情報と,カード上のID情報との照合.  ICCard □ y Q a 心 n a μ a l  ○ 認昌こ 第2章指紋画像の構造化記述法 13    銅線化した隆線をフラクタル曲線によって近似して指紋画像の圧縮符号化を行う方式[川の提    案もなされている.  これら2つの課題に対する解決法は,照合のための特徴抽出と画像の圧縮符号化という異なる目的 のために検討されたものであるため,照合と復元とを行う本人照合システムとしての全体の構成を考 えると,図2ぷこ示すように,従来方式(ConventionjMethod)は,照合用の特徴情報と復元用の画 像情報を別々に必要とする.そこで,本論文では,これまで十分な検討がなされていなかった抽出さ れる特徴情報により,照合及び画像の再生を行う方式(Proposed Method)について提案を行うことと する. −︱﹄ Conventiona1 Method I Proposed Method 図2.2:従来方式と提案方式 2.2.4 システム要求条件  システムの要求条件を以下に記す.  ・本人同定に十分な照合性能を有すること    とりわけ,回転・移動,かすれ,切断などの登録指紋との入力誤差に対する高い耐性  ・高い画像圧縮率  ・符号による照合が可能であること  ・高速処理 2.3 モEヒ5

紋画像の構造化とその記述

 筆者は,指紋の持つ情報を整理し,体系化するために,文書画像構造の国際標準であるODAにならっ てj指紋の持つ情報を整理した指紋ドキュメントアーキテクチャ(Fingerprint Document Architecture) を提案してきた【30】,指紋は,有意点(端点や分岐点)の位置関係と有意点同士を結ぷ隆線の形状とに 個人の特徴が存在し,実際の指紋には手書き文字のような形の変動はほとんどないものの,有意点の 絶対的な座標ではなく,構成要素と構成要素同士の空間的な関係を有意情報として取り扱う.  本論文で取り扱う指紋は2値化・細線化された芯雄画像とする.指紋芯線画像の構造は,図2.3のよ うに階層的に表現できる.すなわち,指紋は,複数の隆線の連結成分(Connec七ed Component)から 構成されており,連結成分には1本の隆雄からなるものと複数の隆線が分岐点により結合されたもの が存在する. I N P U T  ルmれ,ij 仙・ 「1&4心4 た醗gGma I N P U T 図2.1: IC カードを用いた本人確認システム 2.2.2 1Cカード情報の記入/書き換え手順   ・個大悟報の登録は,正当な機関によって本人確認がなされるとICカードが発行され,その場で    個人情報が害き込まれる.   ・ユーザは,必要に応じて,登録情報を書き換えることができるが,その際,正当な機関による書    き換えの承認が必要である. 本方式の特徴として,個人情報はICカードに記録されており,また本人照合が閉じたシステム内でな されるため,ネットワークを介したシステムと比べて情報の盗難の危険性は低減すると考えられる.こ の方法では,ICカードに記録されたデータが不正に上書きされないことが前提となるが,ネットワー クを介して本人確認の際の安全性を高める機能を付加することも可能であると考えられる. 2.2.3 指紋画像処理について  従来の指紋画像処理は,課題別に以下の2種類に分類できる.  1.照合及び検索のための特徴抽出    指紋照合における問題点として,入力方向と位置ずれの問題がある.それらは,入力方向の問題    (指紋が常に一定方向で入力されるとは限らない)と入力部分の問題(常に登録指紋の全体が入力    されるとは限らない)がある.この問題に対して,指紋隆線の端点・分岐点の位置,方向及びこ    れらの特徴点問の隆線数を照合のための特徴とするマニューシャネットワーク方式[27]が有効    とされている.  2.高効率画像圧縮    指紋の最終的な一致確認は,目視によってなされる.そのため,指紋の特徴データだけでなく,    画像データを保存する必要があり,一指紋あたりのデータ量を照合に支障のない範囲で小さくす    る必要があり,画像を圧縮符号化して保存する方式が有効である.例えば,米国では,一日当た    り,30,000を越える指紋データの登録がなされており,連邦警察は,ウエーブレット変換を利用    した新たな高効率画像圧縮方式を採用することとなった【28】との報告がなされている.実際,目    視による照合には,2値化された細線化画像があれば十分であると思われる.この点に着目し,

(12)

第2章指紋画像の構造化記述法 Z 1 角 m e n t s 工 n f o r l n a t i o n 工nter−elezants 工nfor ation 図2.3:指紋画像情報の階層的表現 14  つまり,ここでは,1本の隆雄(両端に端点,または分岐点を持つ線)を指紋を構成する最小要素と して定める.そして,賤線の形状を要素内の情報として,隆雄同士の関係(接続,隣接)を要素間の情 報として記述する.これらは,丁度回路の配線図における素子の形態情報と,素子がどのように接続 されているかを示すレイアウト情報とに相当する.両者の組み合わせで,論理的な指紋画像の構造を 記述する[31]ことができる. 2.3.1 レイアウト情報(隆雄の位置関係)  レイアウト情報にあたるのが,隆雄同士の位置関係(接続・隣接)である.隆雄同士の接続関係は, 図2.4(山田による)に示すように,各特徴点,線分の関係を示す特徴点接続グラフと線分巻の関係を示 す線分接続グラフによって表現される.一方,隆線同士の隣接関係は,隣接隆雄(隆雄の両端マニュー シャから伸ばした法線が最初に交差する他の隆線)の抽出によって,図2.5(山田による)のように表 現される. 2.3.2 形態情報(隆線形状特徴の記述)  照合及び再構成のための重要な要素が隆線形状の記述方式である.筆者らは,これまで,フラクタ 孔フーリエ記述子による隆線の形状記述方式について検討してきた[頌[321が,両者は共に始点及 び,制御点の位置に依存するため,部分的に検出された場合の照合適性は高くない.また,入力ノイ ズに対する耐性がより高い方式が望まれることから,これらの条件を満たすものとして,多重解像度 解析法が有効であると考えられる.例えば,ウェーブレット極値を用いる手法は,認識,原信号の再構 成,データ量圧縮の点で期待できる.今回は,隆雄の形状特徴をウェーブレット変換によって得られる 変換係数の極仙(ウェープレット極値)を用いて隆雄の形状特徴を記述することとする.以下,ウエー ブレット極値について簡単に説明する. ウェーブレット極値  ウェーブレット極値を求めるためには,ウェーブレッド変換を行わなければならない.まず,ウェー ブレット変換を定義するために,時間的にも周波数的にも局在した基本ウェーブレット関数慨りを用 第2章指紋画像の構造化記述法 ml m2 m3 m4 m5 m6 m7 m8

夕月

ロリ哨

r2 r3 r4 r5 j 00000011 00010100 00011000 00110000 lncident Mathx M r3 1234567nommmmmmmm ml m2m3m4m5m6m7m8  00010000  10000000  01000000 j 00010000 00101100 00010000 00000001 00000010 j AdJacency Matrix    (r: 11ne m: polnt) 図2.4:特徴点接続グラフと線分接続グラフ A 15 意する.ウェーブレット関数はこの基本ウェーブレット関数を次式のようにs倍だけスケール変換し て得られる. φ㈹ 一 一 ) (2・1) 解析対象となる信号j(わのウエーブレット変換は,八〇とウエーブレット関数の畳込みで次式のよう に定義される.        罵μり=j(わ*φぷ) ウェーブレッド変換の特徴としては,次のようなものが挙げられる. (2・2) ・局在波形で直流成分がないため,信号の変化[tKを敏感にとらえることができる. ・sを変化させることによって,多重解像度解析を行うことができる.また,高周波成分に対して  は周波数分解能が高くなる,  本研究では文献【33】に従って,ウェープレット変換のうち,離散ウェープレット変換を用いる.こ れは.2進ウェーブレット変換(dyadic wavelet traj!sform)をフィルタリング処理を繰り返すことに よって求められる.まず,次の式を満足するスムージング関数φ(f)を仮定する.

      │φ伺12=Σ│φ(fjω)12十│φ(φω)12       (2・3) j=1

 この式は,各ウェーブレット関数が2つのスムージング関数から独立な部分を抽出した関数になっ ていることを表す.このら(り(=告φ膳))を用いてスムージングされた信号痢ぱ(司を

(13)

第2章指紋画像の構造化記述法

二よ

犬 Ms

M3九

M 3 M4 IMinuUa●NighborPoint

∧≫

RN MNPlist(fromlefttoright) RI M9'十干,M7'十十,M5'十-,M10'+f,M6'十一,M3'十十 R2 M10'-もM7'-+ R4 M4'F,M9'・+…… 図2.,5:マニューシャ隣接点と隆線間情報の記述例 16        &μ副=μω)ら(ω)      (2・4) と表す.このとき,あるローパスフィルタ用ω)を用いると,スムージングされた信号ゐ/岡との関 係を,次式のように表すことができる,        ら+1μω)=用2柚)      (2・5) また,スケールに固有な成分であるウェーブレット変換係数は,j1次解像度からj十1次解像度を除い た部分となり,刮ω)=G(ω),6(ω)を満たすGを導入することによって,次式のように表される.        l‰士lj(副=G{2jω}52J(ω)      (2・6) 以hの方法によって,ウェーブレット変換係数1らは,j=1から順に繰り返し演算によって求める ことができる.この時,逆ウェープレット変換関数φ(ω)を,祠i)と同様に&岡を用いて次の2つ の条件式を満たすようにする.        φ(2ω)=G`(ω)φ(ω)       (2・7)       碑(司12十a(ω)&(ω)=1       (2・8)  これによって,次の計算を繰り返すことによって逆ウェープレット変換を行うことができる.       恥j(司=召‘(2硲)ら11μω)十G゛(2Jω)IF2j+ly(ω) ここで,副司,G(ω),び叫)の定め方には自由度があるが,次のように定めることによって, nに対して前述の2つの条件式を満足している.       珀司=e‘゛/2(α)φJ/2))2" ̄‘‘1        &(司=4jj“'/‰n(ω/2) び○)= 1一個○)12  GO)  (2・9) 任意の (2・10) (2・11) (2・12) 第2章指紋画像の構造化記述法 また,この式によって定めるスムージング関数,ウェープレッ}関数はそれぞれ次のようになる.  尚)=(てンソ)2゛1 φ(硝こ=心宍ミンヅ)2o2 17 (2・13) (2・㈱  多重解像度で表現された信号の特徴をよく表している部分には波形のゼロ交差点や波形のn次導関 数のゼロ交差点などがある.本研究で用いるウェーブレット変換では,波形の山や谷がウェーブレッ ト変換係数の極値,つまりウェープレット変換係数の・一次導関数のゼロ交差点に対応している.その ため,ウェーブレット変換された信号の極値をそのまま特徴点として使用するのが直観的にわかりや すく,後の処理も行いやすい.本研究ではこれらの極値(ウェープレット極仙)を形状の記述に用いる. ウエーブレット極値によるパターン表現は,一種の多重解像度表現であり,次のような性質を有する ことが知られている【34】・   ・形状を解析する方法として,多重解像度解析の持つ有効性を持つ.    変換対象とする関数に偏角関数をとった場合,極値の位置が,あるスケールにおける角の位置,    極値の大きさが大きい程,鋭角を表す.   ・MjlaによるJ!1射影法[35]により,原信号の再構成が可能である.   ・極値による再構成が可能であるため,極値のみを復元用データとして保存すれば良く,データ量    の削減が可能であり,圧縮符号化方式として利用できる. ウェーブレッド極値は,直観的なパターンの性質を簡潔に表現したもの【33】であり,本研究では,有 力な隆線の形状表現手段,及び照合のための特徴情報となると考えられる. ウェープレット極値による隆線の形状表現  隆線形状のウェープレット極値は次のような手順で得られる.  1.隆雄の差分曲率関数を求める.隆雄の全長(瓦)を計算し,瓦<2'lとなる最小の,面は正の    整数)を求め,隆雄を2・1分割する.図2.6に示すようにして求めたq71)=θ,lが差分曲率関数    となる.  2.差分曲率関数をウェーブレット変換する.ウェープレット関数にはSp】ine関数を用いた.Spline    関数は,式(2・13)において,n=2として求められる関数である.  3.得られたウェーブレッド係数のうち,正の極大値と負の極ノjヽ値を極値として取り出す.これらは,    各々凸角,凹角に対応している【33】・  1本の指紋隆雄から算出されたウェープレット極値の例を図2.7に示す.  求めた極値により,次の手順で照合を行う.  参照隆雄を瓦./,照合用入力隆線を瓦.とした時,  1.代表的なスケール&における極値列Ek。4,Eki誠>同値Th)を抽出(ノイズ除去に相当)    但し瓦../=Q。o,d1.0,.1.1,d1.1,…,.ゐ.瓦i。.e1,0,心,o,Qil,diil,…,eiim eは極値の値,d    は極値間の距離を示す.   2.特徴パラメータ(隣接するの極値の値,間隔)の比較    一定範囲内のld1..−d4iに対して,e1.2,f!ゐ.z+1,e111g,e14+1 を比較.一定の同値以内ならば,    一致の可能性ありと判定.(図2.9)

(14)

第2章指紋画像の構造化記述法 Extrema 42 O.2.4司 図2.6:差分曲率関数の測定 Vvavelet Extrema 図2.7:指政隆線から得られたウェープレット極値 2 5 0 18 2.3.3 符号化  図2.10に,相対的位置関係を記述する符号化パラメータのイメージを挙げる.各隆線はその長さに よって,長い順に番号付けがなされる.隆線は,有意点によって細かい要素に分割し,それぞれの要 素の形状をコードに置き換えて表現する.隆線間の情報は,隣接情報と接続情報との2種類に分けて 記され,それぞれ隣接・接続する隆雄の番号によって表現される.その他,指紋画像の復元のために は,各隆線の端点の座標が必要となるため,隆雄の端点の絶対座標または,相対座標を記録する.こ の他に,各隆雄の形状特徴を記述し,また指紋画像の再構成を行うためのウエーブレット極値の情報, 再構成時に端点の配置を行うための端点の絶対座標の情報が必要となる. 2.3.4 照合手順  上記の要領で記述されたデータを元に次の手順で照合を行う.  1.入力指紋の構造解析を行い,要素情報(隆線形状),要素間情報(隆線相互の位置関係)をパラメー    タとして抽出.  2.第1段階:要素情報のうち,類似した成分が一致の可能性が高いと判定された場合,第2段階へ    進む. 第2章指紋画像の構造化記述法 19 3.第2段階:一致した要素成分の隣接要素の要素間情報を検索する. 4.第3段階:要素間情報に記された隣接要素の要素情報について調査し,一致の町能性が高いと判  定された場合は両要素は一致と判定される.そして指紋を構成する,他要素について第1段階  より検索を繰り返す.以後,第2段階,第3段階の処理を繰り返し,一致の可能性を検証する. 2.4 シミュレーション実験  提案方式の有効性を検証するため,指紋を各隆線に分解し,各隆雄に対して茸出したウエーブレッ ト極値から隆線同士の一致可能性を測定する実験を行った. 2.4.1 部分照合実験  まず,ウエープレット極依による基本的な照合性能を検証するために部分照合実験を行った.図 2.12の登録指紋画像(全体:480×480 : 隆雄72本)に対して,同指紋の部分指紋圈2.13)に対して, 各スケールにおける一致候補線分の数を測定した.図2.14∼図2.16には,登録指紋画像の1隆線に対 して,部分指紋内の各隆雄との一致度を照合時の値のずれの許容度を20%∼10%と変化させたながら 計測した結果を示す.部分指紋の隆線8(Line Number 8)が正しい対応隆線である.許容度を下げて いく(照合時の悶偵を下げる)につれて,隆線8の一致度が他隆線と比べて大きくなっており,許容度 を10%とした時は,正しい隆線分が候補として抽出できていることが確認できる.降雄番号は長さが 長いJIにつけられているため,高い許容度では,最長の隆線1の一致度が最も高くなっている. 2.4.2 照合/符号化用パラメータのスケールとの関係について  次にj登録指紋(図2・川を構成する各隆雄に対して,照合/符号化用のパラメータであるウェープ レット極値,極値の間隔のスケールに対する変化の度合を測定する実験を行った.   ・指校内標準極値,極値間隔    まず各スケールにおける極値・極値の間隔の平均値を求め,それを指校内標準極値,極値間隔    とした.各スケールにおける計算結果を表2.1に示す.これより,スケール1における極値の情    報がノイズを多く含んでいるため,類似した特徴が得られているが,スケールを堰くLていく    (解像度を下げていく)と,極値数の減少と共にノイズ,また有意情報も欠落していく.これに    より,結果として不必要なノイズが除かれ,特徴的な有意成分の抽出が行える可能性がある.そ    のための適当なスケールを見出す必要がある. 表2.1:各スケールにおける極値とその標準偏差 スケール 標準極値 (×10-3) 標準間隔 極値の 標準偏差  間隔の 標準偏差 1 -1.70 3.01 2.08 3.11 2 -7.02 3.73 1.66 2.85 3 -4.80 5.77 1.11 2.75 4 -7.82 10.50 0.74 3.79 5 -14.78 21.82 0.57 8.08 6 ,22.08 50.46 0.57 22.34

(15)

第2章指紋画像の構造化記述法 20 ・各スケールにおける隆線の標準値からの差分  上で求めた標準値を基にして,同指紋を構成している隆雄の標準値との差分を以下に示す手順で  測定した.   1.隆線iのスケールHこおける極値配列j7,1を求める.       瓦1={40,d10,QI,心1,Q2,…,Qn_1,din_1,Qn}    (2・15) 2.次式㈲・1朗のように平均差分を求める. △Ekにe= Σこ1固l一Ek討an血rd│ (2・16)  3.各スケールに対して1,2を繰り返して,全ての隆線の平均差分を求める.結果を図2.17に   ぷす. 実験結果より,スケールを大きくしていくにつれて,隆線形状の標準値からのずれが大きくなっ ているのが確認できる.このことは,大きなスケールにおいては,各隆雄間の特徴情報の表現に 差が現れ,隆線形状の個性が際立ってくることを意味している.つまり,解像度を下げることに よって指紋内で特徴的な隆線の検索がしやすくなると考えられる.このことを利用して,解像 度を下げ,隆線のタイプの分類が行えることが想像される.この特徴を生かして,ウェーブレッ ト極値によって表現された隆雄形状の符号化の際に,各指紋内,あるいは一般的に指紋に共通す る雄種(隆線分モデル)をいくつか定め,着目隆線に最も近い隆線分モデルとその差分情報とに よって符号化する手法の導入による効率化が図れる可能性があると考えられる.また,照合の際 に,指校内における特徴的な隆線分を優先的にキーとする方式への応用も考えられる.そのため の,標準値の設定個数,及び決定方法については,さらなる検討を要する. 2.5 まとめ  本章では,まず,指紋の芯雄画像を隆線を単位として構造化し,隆線のレイアウト情報と隆雄の形 状情報とによって,指紋全体の特徴を記述することを提案した.  また,指紋画像処理時に問題となる位置ずれ,かすれ,切断等の入力誤差に対する方法として,部 分照合を可能とすること,及び画像符号化の観点から多重解像度解析法の一種であるウェーブレット 解析によるウェーブレッ}極値によって隆線の形状を記述する手法を提案した.  提案方式に基づいて指紋の隆線形状を鍵とする部分照合実験を行った結果,適当な間値を設定する ことで,提案方式によって一致候補隆雄として対応する隆線が摘出可能であることを確眩した.これ によって,従来,筆者らが提案した手法[31]においては,隆雄長の長いものをキーとして,その形状 パターン,及び隆雄の相対的位置関係をもとに照合を行っていたが,斯たに提案した方式によって,指 紋全体が抽出されない場合でも,部分的な隆雄の形状特徴を鍵として照合が行える見通しを得た.  今後の課題として,サンプルを増やした場合の本方式の照合性能の検証及び,符号化効率について の検討があげられる.しかし,指紋は人間が日常的に使用する指から採取されるため,本方式を実用 化するためには,指紋から安定して芯雄化画像を抽出する技術,つまり,ノイズ除去,芯雄化の技術 が必須となるため,それらの問題を解決する必要がある. 第2章指紋画像の構造化記述法 Figerpnnt lmaplnPut → rQぐel㎡nl Extrema at ScaleN ol erQ 〆 ゛‘ ←一一一一一一一一     d.。 e加 → / ︱ ︱ ︲ I F I ︱ erl ` 丁  ̄ ゛ ‘ ← I X 1 。。一一____加。_吋一一一一 し  d j, J dl,  一一一−一一一一一一一        ΣnSUt [昌已 ̄] →  Wavelet Transform t Wavelet Extrema Distance Disヒ&nce 一一一 一 ●●● 21   1x)cation  lnform』ltionQf S4nificanl Point Data  ForStorage  Forldentification 図2.8:ウエーブレッド極値の導出手順 e ---→  &1 − ヽ r 2 I I I I I I ︱ ︱ j   一一一一一一一一一一-Reference ゝiミでしj Fossibヱy Matcjled 一一一一-、、  /:/ l    e → dj2 U       ejj 図2.9:極値による隆線分の照合の概念

∩ ケヘ犬Tヅゾ

貧1dg● i叙1xb●r 11 1 X 1 ● ・ ・ n t 工 n f o r s a t i o a 1 1 4 J L5 L2 L3 L20 ↓ 4 ↓ Lt 乙4 L10 \ 工 n t e r − 1 1 a a ● a ヒ ● 工 n f o r ・ a ヒ 1 o n N ● t g h b Q g z ● a C Q a a ● c t ● 4 N ● 1 g h b c u r ● 4 CQnn●c.j 1 6 1 3 1 4 4 S 図2.10:相対的位置関係を記述する符号化パラメータ

(16)
(17)
(18)

第丿章文字データの構造化記述法

A→≪

CTI

FTI

SIH

RIH

図3.1:人間による文字の理解

A爪]→

 「 ̄TT ̄¬

汗コ

Slc

Rlc

図3.2:計算機による文字の理解 26 表示する未定義文字処理システム[36]の実現する上での重要な技術である.未定義文字処理システム では,まず人力された文字が登録済みのものであるか否かを判定するための処理が行われる.未定義 文字は文字の上下左右の正しい方向が不明であり,文字認識の性能が入力方向に依存じないことがシ ステムの必須条件となる.既提案のシステム【36】には,文字認識部にモルフォロジー理論【37】に基づ <システムを実装しているが,登録文字数が増加するに連れて,認識処理にかかる時間が増加するこ とは避けられず,認識性能の改善と共に,トータル処理時間が少ないシステムが求められている.  そこで,本論文では,2値化された文字図形に対して,その「字形情報」は境界線の形状に十分に 反映されているという仮定に基づいて,境界線の構造をオブジェクトに輪ゴムをひっかけた時に得ら れる形状情報と画素の反転処理の反復によって得られる情報によって記述していく方法を提案すると 共に,抽出された文字の特徴情報を認識処理に利用する手法について検討する.以下,3.2において, 2次元オブジェクトの形状表現と提案手法のねらいについて述べ,3.3で提案手法の具体的な手順につ いて記す.3.4では,数字の印刷文字に対して提案手法を適用したシミュレーション実験の結果につい て報告し,3.5で結論を述べる. 3.2

2次元オブジェクトの形状表現

 一般的に2次元オブジェクトの形状特徴は,1.局所的なパターンの形状と2.それらの相対的な接 続関係の2つに特徴を分離して記述することによって表現され剔38].形状の記述方式は,用途,観 測スケールによっていろいろな方式が提案されている.1画素単位で記述する方式として基本的な手 法にFreemanのチェーン符号【39】がある.チェーン符号は,観測スケールを最小単位の1画素とす 第3章文字データの構造化記述法 27 ることで,凹凸といった形状情報なしで,方向情報(接続関係)を表現し,全体の形状を表現している が,観測スケールを大きくするにつれて,2次元の任意形状の境界は凹境界と凸境界とからなるため, 着目箇所が凹凸のどちらであるのか,どのような凹凸形状をしているのかを記述する必要がある.ま た,観測スケールを拡大し,3×3図形サイズに限定した場合にオブジェクトの形状を28種類の凹境 界,7種類の凸境界に分類して表現する方法14o】が提案されている.他の方式としては,周波数表現 による代表的なものとして,フーリエ記述子によるものがある.特にP型フーリエ記述子による方法 [41]は,その低域成分によって,オブジェクトの概略形状を表現することが確認されており,オブジェ クトの認識処理においても有効な方法であると考えられる,しかし,これらの方法は,抽出される特 徴から原図形が復元可能であることからわかるように,人間が文字認識を行うための字形情報のみを 表現したものとは言えず,これを用いた認識処理を行う場合は,別途特徴抽出処理が必要となる.  そこで,直感的ではあるが,計算機筆順を生成する斯たな文字の構造解析手法を提案する.提案手 法は,未定義文字処理システムヘの応用を考慮していることから,要求条件として,字体の制約条件 からの独立を目的として以下のように設定した.   .大きさに依存じないこと   ・回転等の幾何学的変換に依存しないこと   ・画像レベルの正規化処理が不要であること 特に,従来のモルフォロジーによる手法では,照合のために図形の骨格化処理を導入しており,処理 速度の改善が求められている.そこで,本論文のねらいを以下の3点に設定する.  ねらい1:輪ゴムによる境界線の解析手法を導入した未定義文字処理システムの設計  ねらい2:字体の制約条件からの更なる独立  ねらい3:処理時間の高速化 3.3 輪ゴムかけによる文字構造特徴の抽出とその記述

 本論文では,提案手法を輪ゴムかけ解析法(Rubberband Fitthlg Analysis)と名付け,以下本文中 では,RR4と記すこととする.j7Fメ1においては,文字構造の特徴を図3.3に示すように,文字の外接 多角形を最低解像度の情報として,外接多角形を構成する各辺を基準として階層的に記述していく. 3.3.1 定義  まず.zh申2]の定義に従って以下の定義を行う.  定義1:有意境界線分と冗長境界線分    pを境界画素とし,Sを対象オブジェクトの境界画素の集合とする.1を1画素の1辺分の長さ    を持つ境界線分で単位境界線分(Unit Baundary Line)とし,Sを境界線の集合とする.この時,    図3.4に示すようにオブジェクトを構成する各画素pが有する単位境界線分の個数を刎p)とす    ると,Mp)=ゆ≦i≦4)でiはo∼4の整数となり,Typeo∼4の5つのタイプに分類される.    図3.5に,境界線情報の定義を示す.まず,n木目の輪ゴムW(n)のうち,オブジェクトと接触    している境界線分を接線7(n)(Touched Line),非接触の線分を空中線祠n)(Floating Line)と    する.また,オブジェクトの境界線jlのうち,n本目の輪ゴムW(n)の接線7(n)と接する境界    線分をW(司に対すゐ有意境界線分・コ(n)(Criticaj Boundary Line),接線と接しない境界線分を    冗長境界線分召(n)(Redundant unit Boundary Line)とする.1本目の輪ゴムW(1)による境界    線はC(1),または斑1)のいずれかに分類されるため,以下の定義が得られる.

(19)

第3章文字データの構造化記述法

豚に口:視察手法による文学僕造解析の概念 28        C‘(1)Uj7(1)=j?      (3・5)   n(2≦司木目の輪ゴムW(司に対してもI司様に以下の定義が成り立つ.       GI)n…nc㈲∩桐n)=o       (3・6)       C(1)U・‥UC'(n)U頂司=B       {3・7} 定義2:有意レベル   初期の輪ゴムによって,抽出される境界線分の方が,オブジェクトの概略をより表現していると   の仮定に基づいて,句)を単位境界線分Hこおける重要度のレベル(有意レベル:Critiea1 Leve1)   を表現するパラメータとし.以下のように定義する.    ・単位境界線分1,がn回目の輪ゴムかけ操作によって抽出される時,j,・の有意レベルは,     翔,)=y・と記される・    ・単位境界線分j,がjjよりも高い有意レベルを有している場合,翔,)>7(り)と記される.    ・境界線集合Xの有意レベルが境界線集合yよりも高い場合,Jli(X)>jj(y)と記される.    ・境界線集合Xの有意レベルが,特定のレベルJ1よりも高い場合は,石l(X)>J1と記さ     れる. 定義3:輪ゴム演算子   境界線集合Bが,RR4によって段階的に変化していく時,i番目のj?R4,を施した後の残存境   界線集合をSi4.1とした場合,残存境界線集合瓦をBμ1に変換する演算子RFふとして次式   により定義する. j?Fふ{扁}=召i士1 (3・8) 第丿章文字データの構造化記述法

14↓4−

0〔N(p)=4) 1(N(p)=3} 2〔N〔p〕=2) 3(?ぶ〔p〕=1) 4 ( ? 1 〔 p 〕 = 0 ) 図3.4:境界画素の境界級長による分類 29 但し,iは特定の有意レベル7,・を示すインデックスであり,7,>私-1,瓦は,な印i)>7,を満 たす境界線集合である。ここで,j?R4を,輪ゴムによって瓦1を瓦。に変換していく処理と 解釈すると        j7F.4al。a,…,。,N・_2,。N_1,。jN・=       j7F,4a-1,d佃瓦4a-2,。Jヽ一一1{‥・{RR4,1,J}}       (3・9) 但し,al,a2,・・・ 「V−2, 「V−1, 「Vは,有意レベルフ。1,心2,・・・Ja_2,ね,v_l,Ja,のそれぞれ に対応するインデックスでありj。1>7.2>,‥>7.7v_2>j。jv_1>j。jvである。以上の条件に より,jZR4は一定の有意レベルよりも高い有意レベルを持つ単位境界線分を消去していくプロ セスとして見なすことができる。 3.3.2 特徴抽出手順  j?R4での境界線の特徴抽出の手順について,具体的な例として文字「7」を対象とした時の特徴抽 出手順を説明する.尚,RR4の処理は連結する画素ブロック単位で行われるため,前処理として,画 像を走査し,連結ブロック単位に切り分ける処理が通常必要となる.図3.6∼3.8において,(a)にはオ ブジェクトが処理されていく過程を,(b)には各過程において抽出された単位境界線分を,(c)には残 存している境界線分を示してある.   ゜stepO∼8tepl    まず,図3.6中の(aO)に示す原図形に対し,画素の4連結性を満足しない画素を境界構成画素と    して,境界線抽出処理を施す.これにより,図3.6(al)を得る.   ●stepl∼step2    前ステップで求めた境界構成画素C図3.6(al))に対して,輪ゴムをあてはめる際の角点となる点    乃`一点八を求め,図3.6(a2)を得る.尚,図3.6(c2)は,残存する境界線情報を示す.   ●step2∼sl:ep3    図3.6(a2)に対して,輪ゴム当てはめ処理を行い,図3.6(a3)を得る.図3.6(c2)のうち,図3.6(a3)

Referensi

Dokumen terkait

Pembuatan sistem informasi lowongan pekerjaan berbasis web mobile merupakan sistem usulan yang ditawarkan agar memberikan kemudahan bagi alumni AMIK BSI Pontianak

Responden dalam penelitian ini adalah Bapak/Ibu/Sdr perawat Rumah Sakit Rahman Rahim Sidoarjo. Peneliti akan memberikan kuesioner yang berisikan pertanyaan mengenai

[1] Tujuan dari penelitian ini adalah untuk mengetahui tingkat kesuburan (fertilitas) karena dalam dua dekade mengalami penurunan, dalam penelitian ini total data

Dalam konteks Syafi’iyah, yang berhujjah pada ijtihad Imam Syafi’i, penggunaan nalar (akal) sebagai media untuk menetapkan suatu hukum yang berkesesuaian dengan

An analysis of Prepositional Phrase found in the Entertainment Articles of the Jakarta Post.English Education Department, Teacher Training and Education Faculty,

Keperluan ini dikehendaki untuk membolehkan seorang penerjemah dalam menganalisa tentang seluk-beluk keistimewaan sebuah puisi dan untuk membedakan makna yang

Adapun tujuan penelitian ini adalah untuk mengetahui, menganalisis dan melihat pemanfaatan jaringan tetangga sebagai tenaga kerja yang terbangun dalam usaha industri konveksi