Repository logo
  • English
  • 中文
Log In
Have you forgotten your password?
  1. Home
  2. College of Electrical Engineering and Computer Science / 電機資訊學院
  3. Communication Engineering / 電信工程學研究所
  4. Enhanced Semantic Retrieval of Personal Photos Using Random Walk and Distributed Word Representations
 
  • Details

Enhanced Semantic Retrieval of Personal Photos Using Random Walk and Distributed Word Representations

Date Issued
2015
Date
2015
Author(s)
Liou, Yuan-Ming
URI
http://ntur.lib.ntu.edu.tw//handle/246246/276657
Abstract
本論文探討在使用者加入稀疏語音標註之條件下,如何進行有效的個人相片語意檢索(semantic retrieval of personal photos)。由於近年來數位相機及智慧型手機十分普及,使用者通常會迅速累積大量的個人相片,隨之而來的一個重要問題便是如何在數量龐大的個人相片資料庫中快速瀏覽與搜尋。一般使用者都喜歡直接用語意式查詢指令(semantic query) 來找相片,例如「母親節聚餐」。但以前的個人相片檢索多半是以內容為基礎的影像檢索(content-based image retrieval, CBIR),倚賴影像低階描述特徵且必須以一張相片作為查詢指令(query),並不適用於使用高階語意概念(high level smenatic concepts) 的影像檢索;而以語意為基礎的影像檢索則非常倚賴影像相關的標籤(tags) 或標註(annotations),但使用者不太可能把所有的相片都加上標註,且使用語音標註的方式又比使用鍵盤輸入的文字標註來的更為方便,所以本論文把主題設定在使用者輸入稀疏語音標註之條件下的個人相片語意檢索,亦即有少數相片上有語音標註。實現的方法主要是利用主題模型(topic model) 整合語音和影像特徵,並使用隨機漫步模型進行重新排序(re-ranking),最後再提出使用分佈式詞會表示法(distributed word representation) 來舒緩語音特徵稀疏的問題。 首先,由於語音標註可能在任何地方被錄製,可能是非常自發性的 (spontaneous) 說話方式,所以導致辨識率低下,所以利用詞圖進行抽取字詞頻率頻率期望值(expected term frequency) 當作是語音特徵,但只有少數的相片有語音標註,所以我們必需對每張相片抽取局部(local) 與全域(global) 的影像特徵,來補充語音特徵所遺漏的資訊。而本論文利用主題模型來整合語音和影像特徵,並以此模型訓練出來的「潛藏主題」建構檢索模型。 此外,我們發現主題模型的檢索效能還有很多進步空間,所以把從主題模型檢索出的首次檢索結果(first-pass retrieval results) ,基於字詞頻率期望值、局部與全域的影像特徵計算相片之間的相似度,再套用隨機漫步模型(random walk) 演算法,讓相似度越高的相片獲得越相近的相關分數(relevance score) ,進而達成重新排序的效果,並使其檢索效能獲得相當大的進步。 此外,我們發現由於語音特徵非常稀疏,導致在訓練主題模型時就特別仰賴影像特徵,但其實語音特徵才是最主要提供使用者個人化與語意資訊的來源,所以進一步使用近年在尋找語意(semantic) 和句法(syntactic) 相關詞的任務中有良好表現的分佈式詞彙表示法,基於字詞頻率期望值與整體影像語意概念,以類似自動增加標註的方法找出相關詞並加入語音特徵中,讓原本稀疏的語音特徵不再稀疏,進而讓主題模型在訓練時考慮更多個人化與語意相關的資訊,並且也讓隨機漫步模型重新排序的效能也更好。
Subjects
retrieval
random walk
word representation
personal photos
Type
thesis
File(s)
Loading...
Thumbnail Image
Name

ntu-104-R02942070-1.pdf

Size

23.32 KB

Format

Adobe PDF

Checksum

(MD5):857f7f72ad197109e6c2bb96a3f52c12

臺大位居世界頂尖大學之列,為永久珍藏及向國際展現本校豐碩的研究成果及學術能量,圖書館整合機構典藏(NTUR)與學術庫(AH)不同功能平台,成為臺大學術典藏NTU scholars。期能整合研究能量、促進交流合作、保存學術產出、推廣研究成果。

To permanently archive and promote researcher profiles and scholarly works, Library integrates the services of “NTU Repository” with “Academic Hub” to form NTU Scholars.

總館學科館員 (Main Library)
醫學圖書館學科館員 (Medical Library)
社會科學院辜振甫紀念圖書館學科館員 (Social Sciences Library)

開放取用是從使用者角度提升資訊取用性的社會運動,應用在學術研究上是透過將研究著作公開供使用者自由取閱,以促進學術傳播及因應期刊訂購費用逐年攀升。同時可加速研究發展、提升研究影響力,NTU Scholars即為本校的開放取用典藏(OA Archive)平台。(點選深入了解OA)

  • 請確認所上傳的全文是原創的內容,若該文件包含部分內容的版權非匯入者所有,或由第三方贊助與合作完成,請確認該版權所有者及第三方同意提供此授權。
    Please represent that the submission is your original work, and that you have the right to grant the rights to upload.
  • 若欲上傳已出版的全文電子檔,可使用Open policy finder網站查詢,以確認出版單位之版權政策。
    Please use Open policy finder to find a summary of permissions that are normally given as part of each publisher's copyright transfer agreement.
  • 網站簡介 (Quickstart Guide)
  • 使用手冊 (Instruction Manual)
  • 線上預約服務 (Booking Service)
  • 方案一:臺灣大學計算機中心帳號登入
    (With C&INC Email Account)
  • 方案二:ORCID帳號登入 (With ORCID)
  • 方案一:定期更新ORCID者,以ID匯入 (Search for identifier (ORCID))
  • 方案二:自行建檔 (Default mode Submission)
  • 方案三:學科館員協助匯入 (Email worklist to subject librarians)

Built with DSpace-CRIS software - Extension maintained and optimized by 4Science