• Tidak ada hasil yang ditemukan

論文内容の要旨(博士)

N/A
N/A
Protected

Academic year: 2024

Membagikan "論文内容の要旨(博士)"

Copied!
2
0
0

Teks penuh

(1)

別紙4 (課程博士)

Department 侑報

Pplicant's name

氏名

知能工学専攻

.

MDZIAULLAH

Title ofThesis

博士学位論文名

Studen11D Number

今女条谷1旨・号・

(Approx.80o words)

(要旨 1,200字程度)

Bipa11ite Graph Based Ranking Methods for subtopic Mining and Genetic Disease

Prediction

(サブトピック・マイニングと遺伝病予測のための二部グラフに基づくランキング乎法)

\vith the vast amount of infonηation available on tl)e lnternet in the forms of \Neb pages such as news a11icles,

microblog posts, and shopping sites, a search engine has become an essential to010f oul' daily life to explore

information on the lnternet. when an inf01'mation need comes up in mind, the user expresses it into a set of

Words (aka. a query) and issues the query to the search en即ne. currently, given a query, a search engine responds a l・anked ⅡSt of documents to satisfy the information needs of the user. Howevel', if the users issued query conveys a variety of interpretations, the search result is far 介om the 、vhat the usel' rea11y wants to

Search." Therefore,、ve assume that "whatthe user rea11y 圦,ants to search is the user s search intent.

弟 115309 号

Date of submission

論文内容の要旨(博士)

平成

Abstract

Supervism'S

指導教員

年四月

2016

According to uS引・ search behavior analysis, the search query is usua11y short, ambiguous, onηay entail multiple Search intents.1Ssuing uw salne query, users may have different information needs, which corresponds to

diverse seal・ch intents. Traditionalinformation retrieval models, including the boolean model and the vector

Space model, treat the issued query as a clear, weⅡ・de6ned representation, and completely neglect any s01't of ambi8Uities.1gnoring the user's intents underlying a query, infonnation retrieval models may result in documents, possibly c0爪aining too much l'elevant infonnation on a paHicular aspect of a query. As these documents cover only a few intents or interpretations, d〕e uS引' may not be satisfied.

MASAKIAONO 23日

To satisfy the usel・S'intents in their 圦leb search, a practical approach is to diV引'sify the documents f01、the given Search query, that is to present a ranked list of documents by taking into accoU川 the covel'age, popularity, and novelty of the searcl) intents underlying a query. Therefore, exploring the possible seal'ch intents oft1祀 query is

an essential need forthe next・generation search engine.

Exploring the search intents underlying a query has gained much intel'est in recent yeal'S. Researchel's have Proposed several methods fo"ηinjng subtopics as search intents by exploiting different resources,including the top retrieved documents, query l08S, xvikゆedia, anchor texts, and the query suggestions provided by the Commercial search engines. Query suggestions hold some search intents, however, suggested 甲leries are often noisy and possess a group of similar suggestions covering a single intent of the query. Moreovel, the seal'ch quel・y and tl〕e search intents (i.e. subtopics) are S110rt in length. Thus, it is a chaⅡenging task to estimate the

Semantic and contextual similarity between a pair ofshorttexts.

J1︑4气

(2)

In this dissertation, we have developed a novel framework that explores the subtopics covering intents

Underlying a query, estimates subtopic imp011ance, and diV引'sify them by considering the Nlevance and

novelty. To diversify the search results, we have devised a ne、v way of ranking based on a ne、v novelty estimation that faithfUⅡy represents the possible search intents oftl〕e query. For representing subtopic,、¥e have

Proposed ne、v semantic features based on a word・embedding modelto capture the semantic matching of a

query with a candidate subtopic. To rank a set ofcandidates, we have developed a bipaHite graph・based ranking method of estimating the globalimp011ance of the candidate subtopic by aggre8ating the local hηP011ance of

each featul'e.

Estimatlng the contextual similarity between a pajl' ofshod texts is a formldable task. T、vo sh011texts might not be lexica11y similar, however, semantica11y similar. our observation is that if t、vo sh01't texts represent tlw Similar meaning, even though they are not lexica11y similal', they may result in similar kinds of documents from a search engine. Mutualinfonれation between t、VO PI'obability distributions of words, extracted from the Correspondin8 documents, may represent the contextual similarity bet、veen two sh011 texts. Therefore, we have P】・oposed a contextual similarity function for sh011 texts t11rough tl)e probability distributions ofterms in the top retl'ieved documentS 介om a search engine.

'ー

Xve have experimented and evaluated the proposed methods, and compared wilh the eal'1ier methods on bencl]mark data sets. we have conducted exP引'iments on the intent mining test c011ections, induding NTCIR、10 and NTCIR、12, and web corpus, including clueweb09・cat・B and clueweb12・BB. Experimental results demonstrate the effectiveness ofour pl'oposed methods in compal'json to the known earⅡe↑ methods.

In the meantime, with a vast amount of medical knowledge available on the lnternet, il is becoming incl・easingly vital to help doctors in dinical diagnostics by suggesting plausible diseases predicted with data and text mining techn010gies.1n this disse11ation, we have also proposed to rank genetic diseases for a set of Clinical phenotypes.1n this regard, we have associated a pl〕enotype・gene bipa11ite graph (PGBG) with a gene、disease bipanite gl'aph (GDBG) by producing a phenotype・disease bipartite graph (PDBG). To estimate the impodance weight of an edge in pDBG, we have developed a Bidirectiona11y・induced lmportance \Neight

(BIXU) PI'ediction method to pDBG by considering the content and link information 介om both sides of the

bipal・tite graph. The experimenta11'esults exhibit thal our proposed BI\v method has oU印el'f01'med the kno、vn Previous methods in tlw disease retrleval system.

Referensi

Dokumen terkait

作と研究が直接的な関係をもち、博士論文を作品と論文のかたちとする場合の美術大学な らではのあり方として評価できる。 ●本論文は、自作の手法の理論的根拠を明らかにすることに端を発しているが、自作の手 法における形式の流動性の発見により、映像の領域の独自性が、形式そのものの流動性に あることの結論に至り、映像全体に展開される定義を新たに加えたことには意義がある。

155 附 錄 附錄一: 系統性回顧資料檢索策略 Breathing Exercises interventions for stroke or COPD patients The Cochrane library search strategy Searches Results #1 Strokes OR Apoplexy OR CVA

This study analyzes the developmental process of policy in Japan for ensuring employment of older persons under the time classification considering the role of a job-skills development

ニングとして利用することが可能となる点において意義のある結果が得られるものと考え る。 3.研究の枠組み 本研究は以下のとおり、予備研究と二つの本研究からなる。 1)予備研究「下腿周囲長計測における検者間信頼性について」 2)研究1「地域在住高齢者におけるCAI-身体機能および転倒との関連-」

Ⅰ.はじめに 1.研究の背景 わが国は 2009 年に「本格的な高齢社会」となっている1。国の人口動態統計では、家庭 内の不慮の事故は高齢者が多く、種別では溺死でき水が多い 2。東京消防庁の不慮の救急 事故の統計では、高齢者は転倒事故が多く場所は居間が多い 3。調べた限りでは、家庭内 事故の体系や分析方法が明確でないと思う。高齢者自身の事故予防に対する意識について、

論文の内容の要旨 論文題目 : Rigidity theorems for universal and symplectic universal lattices 普遍格子と斜交普遍格子の剛性 定理 氏名 : 見村万佐人 本学位論文では,普遍格子universal latticeおよび斜交普遍格子symplec- tic universal

K and Taki, H.:, An Evaluation of Pictograms for Communication among Japanese and Thai-speaking Engineers Working in Manufacturing Settings, to appear in the Proceeding of