線上訂房服務-台灣趴趴狗聯合訂房中心
發文 回覆 瀏覽次數:2702
推到 Plurk!
推到 Facebook!

關於文字擷取的幾個問題(k-mean..canny...CCL)

尚未結案
dicky9055
一般會員


發表:20
回覆:48
積分:18
註冊:2006-08-02

發送簡訊給我
#1 引用回覆 回覆 發表時間:2008-03-10 10:52:11 IP:203.79.xxx.xxx 訂閱
想問一下各位大大
圖1.是我的原始圖



圖2.則是我利用canny edge所得到的圖,但有取字不完整的地方..想問一下這樣的情況要怎麼解決呢???





圖3..利用連通元件演算法所擷取出來的圖...

想問一下..
我要如何對每個cc進行rgb色彩的統計並且利用kmean去分群..以找出文字區域的所在呢???
也就是cc進行rgb色彩的統計(這部分程式要怎麼去寫呢..能給我個觀念嗎)
還有kmean的話通常要怎麼去設才能得到比較好的分群效果~~

麻煩大大們為我解答一下..感謝
yulong375
一般會員


發表:2
回覆:22
積分:19
註冊:2007-03-15

發送簡訊給我
#2 引用回覆 回覆 發表時間:2008-03-10 16:43:38 IP:218.162.xxx.xxx 訂閱
可以參考這篇的作法,arisaka_matsuri兄做了個範例供參考...

水平投影後的分割問題 delphi.ktop.com.tw/board.php

想問一下,你是直接對圖1做canny edge嗎?
如果先對圖1做二值化再做canny edge,效果不知道會不會好一點。

以上僅供參考,如果還有問題歡迎再做討論!!
------
我還是很新的新手,如果回答的太笨拙還請各位多多包含!!
編輯記錄
yulong375 重新編輯於 2008-03-10 17:17:44, 註解 無‧
dicky9055
一般會員


發表:20
回覆:48
積分:18
註冊:2006-08-02

發送簡訊給我
#3 引用回覆 回覆 發表時間:2008-03-10 23:37:52 IP:203.79.xxx.xxx 訂閱
大大給的這篇我看過..
但想問的是..我己採用了ccl的方法了...那投影的方法是要用來做什麼的..
還有..如何應用在kmean上...

另外..我先二值化過..好像效果差不多耶..不知是我的程式有問題..還是..怎樣

===================引 用 yulong375 文 章===================
可以參考這篇的作法,arisaka_matsuri兄做了個範例供參考...

水平投影後的分割問題 delphi.ktop.com.tw/board.php

想問一下,你是直接對圖1做canny edge嗎?
如果先對圖1做二值化再做canny edge,效果不知道會不會好一點。

以上僅供參考,如果還有問題歡迎再做討論!!
yulong375
一般會員


發表:2
回覆:22
積分:19
註冊:2007-03-15

發送簡訊給我
#4 引用回覆 回覆 發表時間:2008-03-11 01:29:51 IP:218.162.xxx.xxx 訂閱
這是我的想法,你當做參考參考就好...

首先,你的方法是先做canny edge -> 利用連通元件演算法 -> 最後用kmean去分群

但你是否有發現,若你直接用canny edge 下去做的話,非文字的地方還有文字過於淺的地方都會因此而被顯現出來,
其實做辨識,做重要的就是如何濾除雜訊、排除非目標物來提升辨識率,
我之所以建議你先執行二值化,是因為我看到你的圖2,連非文字的東西都無法濾除,
再做下去也只會使自己更麻煩,下面是我測試二值化的結果,雜訊明顯濾除了許多...

再者,請你參考arisaka_matsuri兄那篇的主因是,它提供了一個分群的方法,利用垂直投影的方式,
來得知 "字串" 與 "字串" 之間的距離,只要再加以設定門檻值就可以達到分群的效果。如下圖:


上下圖對照,有發現 "字串" 與 "字串" 之間的間距了嗎?如此便可以達到分群的效果了!!

回到你的第2步,其實我不太明白你在這步為什麼要做 "連通元件演算法" 的動作?用意何在?
------
我還是很新的新手,如果回答的太笨拙還請各位多多包含!!
dicky9055
一般會員


發表:20
回覆:48
積分:18
註冊:2006-08-02

發送簡訊給我
#5 引用回覆 回覆 發表時間:2008-03-14 09:47:53 IP:203.79.xxx.xxx 訂閱
真的很感謝大大的回覆!!
嗯..我發覺原來是我程式上有問題
所以二值化後再canny真的效果好很多....

至於會用連通元件演算法
是因為我之前用水平..垂直投影的方式去抓文字..
好像有蠻大的問題
但有點忘了是什麼問題..所以後來有人告知我用連通元件的方法去抓..
而看了很多paper也發現大部分的人都是用這個..
所以想問問大大..有沒有什麼可以用在ccl上的分群法可以用!!~
最主要的是我要如何單單針對所有抓出來的ccl..進行每個ccl的色彩統計..利用kmean去分群


===================引 用 yulong375 文 章===================
這是我的想法,你當做參考參考就好...

首先,你的方法是先做canny edge -> 利用連通元件演算法 -> 最後用kmean去分群

但你是否有發現,若你直接用canny edge 下去做的話,非文字的地方還有文字過於淺的地方都會因此而被顯現出來,
其實做辨識,做重要的就是如何濾除雜訊、排除非目標物來提升辨識率,
我之所以建議你先執行二值化,是因為我看到你的圖2,連非文字的東西都無法濾除,
再做下去也只會使自己更麻煩,下面是我測試二值化的結果,雜訊明顯濾除了許多...

再者,請你參考arisaka_matsuri兄那篇的主因是,它提供了一個分群的方法,利用垂直投影的方式,
來得知 "字串" 與 "字串" 之間的距離,只要再加以設定門檻值就可以達到分群的效果。如下圖:


上下圖對照,有發現 "字串" 與 "字串" 之間的間距了嗎?如此便可以達到分群的效果了!!

回到你的第2步,其實我不太明白你在這步為什麼要做 "連通元件演算法" 的動作?用意何在?
系統時間:2024-04-16 17:13:19
聯絡我們 | Delphi K.Top討論版
本站聲明
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。
2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。
3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇!