電機資訊學院: 資訊工程學研究所指導教授: 李明穗陳瑋宗Chen, Wei-ZongWei-ZongChen2017-03-032018-07-052017-03-032018-07-052015http://ntur.lib.ntu.edu.tw//handle/246246/275400近年來,均衡營養的飲食漸漸受到人們的重視。為了維持健康且均衡的飲食,使用者必須記錄每一餐的飲食類別,並根據這個紀錄規劃接下來的飲食內容。但是,在手機上頻繁的輸入文字會造成使用者的不便。因此,本論文設計了一套系統,利用拍攝照片的方式自動記錄飲食的種類。 在這個系統中,我們提出了一個簡單而有效的影像辨識方法。首先提取出各個色彩通道的局部二元辨識模式(local binary pattern)描述子。接著對每個影像區塊進行直方圖(histogram)統計,串接各色彩通道的直方圖。接著,我們利用稀疏編碼(sparse coding)的方式擷取視覺字字典,並依此對影像區塊編碼。在聚合各區塊的部份,我們使用平均聚合(mean-pooling)的方式聚合影像區塊的編碼。最後,我們使用均勻核對應(homogeneous kernel mapping)轉換我們的特徵向量,可讓我們以線性支撐向量機(linear support vector machine)近似核支撐向量機(kernel support vector machine)。另外,我們還整合了一個簡單的資料集強化方式(data augmentation),利用翻轉的局部二元模式描述子(flipped local binary pattern),在不增加計算量的情況下,倍增我們的訓練資料。 實驗結果顯示,我們能夠在Chen等(2012)提出的資料集與方法中,得到明顯的辨識率提升,並且有效地降低訓練時間與預測時間。Balanced nutrition diet has been gained more attention recently. To keep balanced diet, users have to record each meal for a long period. However, typing on cellphone is inconvenient. To solve this problem, we proposed a system which records what we eat by taking photo. In the system we proposed a simple but effective recognition method. First, for each channel, we extract local binary pattern, calculate descriptor histogram for each image patch. Then we concatenate channel histogram together. Second, we learn a visual dictionary, encode the patch using sparse coding, and aggregate descriptors with mean pooling. Finally we transform our feature vector obtained above with homogeneous kernel mapping, which approximate kernel support vector machine with linear model. Besides, we introduce a method to augment the dataset by flipping local binary pattern. The experiment shows that we have better accuracy than the method proposed by Chen et al. (2012), and reduce consumed time effectively.465813 bytesapplication/pdf論文公開時間: 2015/8/10論文使用權限: 同意有償授權(權利金給回饋學校)食物影像辨識影像辨識局部二元模式稀疏編碼均勻核對應food recognitionimage recognitionlocal binary patternsparse codinghomogeneous kernel mapping運用紋理分析與均質核對應進行食物辨識Texture-Based Food Recognition Using Homogeneous Kernel Mappingthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/275400/1/ntu-104-R02922088-1.pdf