日期:2014-05-18  浏览次数:20938 次

[求助]windows7下用C#做OCR报错问题!(用的Microsoft Office Document Imaging)
RT,代码如下:
C# code


private String ocr(String ppath)
        {
            MODI.Document doc = new MODI.Document();
            doc.Create(ppath);
            MODI.Image image;
            MODI.Layout layout;
            string ret = null;
            //doc.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);//识别英文
            doc.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, true, true);//识别中文 这里报错!!!!!! 说:外部组件发生异常。
            for (int i = 0; i < doc.Images.Count; i++)
            {
                image = (MODI.Image)doc.Images[i];
                layout = image.Layout;
                ret += layout.Text;
            }
            return ret;
        }




写了一个方法来识别图片的文字,但是做ocr的时候报错,如果用上面那句:doc.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);//识别英文的话不会报错,可以出结果。

已下载并安装微软的简体汉字识别引擎:CHSOCR.msi,但是这玩意是2004年的,适用范围到xp为止,没有说支持vista和win7,是不是这个原因呢?但是在官网上没有找到支持win7的chsocr引擎啊....
谢谢大家!


------解决方案--------------------
微软的不用就用别家的,google的也可以,虽然识别率不高,还有收费的,反正你不拿商用,d一个来用下。