2012年1月31日 星期二

用 清華紫光 TH-OCR 辨視韓文

1. 先下載 TH-OCR
URL: http://blog.sina.com.cn/s/blog_49ee6d690100ixe4.html
or
URL: http://u.115.com/file/f690399e2b


2. 設定字型:
韓文字型的話, 可以使用 GulimChe 或 GungsuhChe



3. 執行 TH-OCR, 並開啟抓到的圖檔, 點選 Recognize(辨視).



4. OCR 的結果.




5. 再透過 google translate 來看答案.



更簡單的方式, 是透過 JOCR:
http://philtzki.pixnet.net/blog/post/5189840
(這個需要安裝 office 2003 以上的版本, 透過office 內建的OCR元件來辨視)



附註: OCR 都會有這一個問題, 就是您抓取的圖片太小, 會造成圓形與正方形在判斷上會誤判,
例如:
한고객이 매매 할수 있는최뎨매수는 4입니다. 翻出來是: 營銷可以有遊客,將染料中的最大數是4
한고객이 예매 할수 있는최뎨매수는 4입니다. 翻出來是: 保留可以有遊客,將染料中的最大數是4

說明: 第1行的正方形是誤判, 把 source image 放大後, 再減少亮度, 增加對比後, 即可判斷為圓形.

沒有留言:

張貼留言

Facebook 留言板