國立臺灣大學電機工程學系暨研究所貝蘇章2006-07-252018-07-062006-07-252018-07-062004-07-31http://ntur.lib.ntu.edu.tw//handle/246246/8009本論文為了達到完美的語言翻譯,我們提出了一個新的 文字偵測技術,可達到一個極低的假警報率。首先,以類神 經網路的彩色量化法使得顏色類似的文字可被量化成相同的 顏色,接著我們使用三維的統計長條圖分析法來選擇幾個可 能的文字候選色,如此,對於每個可能的文字候選色我們可 以分別萃取出它們的相對雙色調圖,之後我們使用相連物件 分析法與兩個型態學的運算子於每一張雙色調圖來找出可能 的文字區域,最後,我們使用高斯的拉普拉邊緣檢測器來對 可能的文字區域作更進一步的確認,同時,多層量化的技術 可以讓我們大大的降低假警報率。In order to achieve good translating performance, we propose a novel approach to detect text in color images with very low false alarm rate. First of all, neural network color quantization is used to compact text color. Second, 3D histogram analysis chooses several colors candidates, and then extracted each of these color candidates to obtain several bi-level images. For each extracted bi-level image, connected component analysis and several morphological operators are fed to hold some boxes that are possible text regions. At last, we can use L.O.G edge detector to authenticate accurate text regions from each possible text regions. Meanwhile, in complex color images, multiquantization layers can be integrated to reject non-text parts and reduce false alarm rate.application/pdf100376 bytesapplication/pdfzh-TW國立臺灣大學電機工程學系暨研究所文字偵測色彩量化彩色影像類神經網路Text detectioncolor quantizationcolor imagesneural network智慧型音視訊和傳輸技術及多媒體應用-子計畫一: 視訊的智慧型高階處理(II)Intelligent High level Video Processing (II)reporthttp://ntur.lib.ntu.edu.tw/bitstream/246246/8009/1/922219E002016.pdf