TH-OCR 2000 清華OCR 2000 中文版 --=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= http://89.to --=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= 軟體名稱:TH-OCR2000清華OCR2000 語系版本:中文版 光碟片數:單片裝 破解說明: 系統支援:Windows95/WIN98/ME/WIN-NT/WIN2000 軟體類型:掃瞄軟體 更新日期:2008.01.01 相關網址: 中文網站:http://xyz2009.net 軟體簡介:(以官方網站為準) --=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= 清華TH-OCR系統的特點!!! 清華TH-OCR的基本原理和主要設計思想 無論從使用數量上,還是結構本身,漢字都是比較複雜的,漢字識別中也提出了多 種方法,目前所用的方法,大致可以分為五類︰ 基於偏旁部首的模板匹配法。 基於漢字的端點、結點、交點,岐點等特徵點的描述識別方法。 基於筆劃部件的漢字結構描述的識別方法。 基於微特徵的層次彈性匹配識別方法。 基於“人工神經元網絡”技術的漢字識別方法。 就目前狀況而言,這些方法在不同程度上解決了簡體印刷漢字的多體或單體識別, 但未能較好地解決多體繁體字以及多體的打印件、複印件的識別,也未能解決印刷 質量嚴重下降時的印刷漢字識別問題,尤其是未能解決漢英兩種文字混排識別的問 題。 清華TH-OCR採用了包括掃描儀自動亮度調節(ABA,即AutomaticBrightness Adjustment)、版面的自動分析(ALA,AutomaticLayoutAnalysis)、基於回掃的二 次分離、基於外形重心的組合歸一化、基於結構元和外形形態特征的組合優化特徵 和基於漢英混排識別的總體識別方案等一系列全新的理論、算法和技術,並提供了 用戶自學習功能。因此,清華TH-OCR系統性能優異,功能完善,滿足不同用戶的 需求,代表了當今印刷漢字識別的最高水平。 清華TH-OCR的主要特點 與國內外中英文OCR系統相比較,清華TH-OCR在技術上獨具五個突出特點︰ 漢英雙語混排同時識別,識別率最高,居國際領先水平。經過數十萬字的嚴格測試 ,總體正確率超過98.5%,對其中印刷質量較好的材料,識別正確率超過99.5%。 支持Windows環境下的多種漢字內碼(BIG5/GBcodes),也可以用於中英文版的Win dows95/98及WindowsNT,並支援日文JIS及SHIFT-JIS內碼,適合全球各個地區使 用。 支持Windows環境下表格文字混合識別,並支援RTF表格格式。 支持橫、豎版面自動切割及同時識別。 首創識別結果按原文進行版面復原。 支持將識別結果自動送入其它的應用程序和剪貼板,方便而實用。 增加了純英文的識別,而且可以識別斜體英文,克服字符間的粘連。 可以使用中英文界面,選擇輸出英文數字的全角或半角等等。 開放式的系統結構可方便地與各種需要使用漢英識別的環境或系統相連。 此外,清華TH-OCR還具有自學習功能,不論什麼生僻字,用戶都可以通過鍵盤輸入 進行學習,這一功能大大方便了需要輸入專業性較強的印刷文本材料的用戶。從另 一個角度講,也大大拓寬了中文OCR系統的字符集。 清華TH-OCR與絕大部份掃描器皆可完美地結合,只需要在相應的軟體中將圖象輪廓 用鼠標拖動到OCR按鍵上,就可以實現中英文字符的自動識別並返回。同樣,清華 TH-OCR也可以同所有的掃描儀和應用軟體很好地結合。 清華TH-OCR的研究範圍是13,000多個中文繁體字及6,000多個中文簡體字,能識別 印刷質量比較差的字符,對手寫楷書也有一定的適應性。 在應用方面,清華TH-OCR也獨具特色,主要包括︰ 在整個系統風格上,有三個新特性︰一是使用Windows標準的菜單和工具列,常用 功能可以直接用工具列;二是提供全局和局部兩個圖象窗口,並可以調整其大小和 顯示比例;三是圖象部分與編輯部分使用同樣的操作界面,方便使用。 在掃描中,既可以使用TWAIN的標準界面,也可以使用戶自己定義的界面。同時有 三個新特點︰一是提供圖象反白的選項,可以掃描白底黑字或黑底白字;二是直接 濾除圖象邊緣的空白,提高處理速度;三是可以自動或手動選擇掃描的亮度參數。 而且在手動選擇時,可以直觀圖示。 提供包括旋轉圖象、反白圖象和剪裁圖象邊緣等基本的圖象處理功能。 提供了熱鍵(HotKey),在識別的可疑字之間移動光標;也可以對光標所在的文字行 進行字符逆序,調整從右至左排版的字符順序。 --=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=