当前位置: 首页 > news >正文

网站建设公司调研汇报ppt湛江市企业网站seo点击软件

网站建设公司调研汇报ppt,湛江市企业网站seo点击软件,电商网站支付方案,信息流优化师前景各个工具下载链接在文章底部#xff01; 重要#xff01;#xff01;自己先创建一个空文件夹(名字随意)#xff0c;用来保存训练后的模型 ,还需要在里面创建一个 名称为tessdata 的文件夹 #xff0c;必须叫这个名 可以先使用下载后的进行测试训练#xff08;只需要把ja… 各个工具下载链接在文章底部 重要自己先创建一个空文件夹(名字随意)用来保存训练后的模型 ,还需要在里面创建一个 名称为tessdata 的文件夹 必须叫这个名 可以先使用下载后的进行测试训练只需要把java文件里面的文件路径更换为你自己下载包的存储路径图片必须使用下载包里面的图片因为是训练的是下载包里面的图片\color{#2111f1}可以先使用下载后的进行测试训练只需要把java文件里面的文件路径更换为你自己下载包的存储路径图片必须使用下载包里面的图片因为是训练的是下载包里面的图片可以先使用下载后的进行测试训练只需要把java文件里面的文件路径更换为你自己下载包的存储路径图片必须使用下载包里面的图片因为是训练的是下载包里面的图片 1、运行tesseract−ocr−w64−setup−v4.0.0.20181030.exe文件安装完之后配置系统环境变量最基本就不叙述了\color{#21a2f1}1、 运行tesseract-ocr-w64-setup-v4.0.0.20181030.exe 文件安装完之后配置系统环境变量最基本就不叙述了1、运行tesseract−ocr−w64−setup−v4.0.0.20181030.exe文件安装完之后配置系统环境变量最基本就不叙述了 D:\Program Files (x86)\Tesseract-OCR 只是我配置的路径就是安装的根路径 在后面用来生成.box文件2、使用jTessBoxEditor生成训练样本的的合并tif图片图片是已经准备好的亦可以自己准备\color{#21a2f1}2、使用jTessBoxEditor生成训练样本的的合并tif图片 图片是已经准备好的亦可以自己准备2、使用jTessBoxEditor生成训练样本的的合并tif图片图片是已经准备好的亦可以自己准备 打开jTessBoxEditor选择Tools-Merge TIFF进入训练样本所在文件夹选中要参与训练的样本图片 点击 “打开” 后弹出保存对话框选择保存在当前路径下文件命名为 “zwp.test.exp0.tif” 格式只有一种 “TIFF” 可选。 注意tif文面命名格式[lang].[fontname].exp[num].tif lang是语言fontname是字体num为自定义数字。 比如我们要训练自定义字库 zwp字体名test那么我们把图片文件命名为 zwp.test.exp0.tif 3、使用tesseract生成.box文件\color{#21a2f1}3、使用tesseract生成.box文件3、使用tesseract生成.box文件 在上一步骤生成的“zwp.test.exp0.tif”文件所在目录下打开命令行程序执行下面命令,执行完之后会生成zwp.test.exp0.box文件。 执行如下命令 tesseract zwp.test.exp0.tif zwp.test.exp0 batch.nochop makebox4、使用jTessBoxEditor矫正.box文件的错误\color{#21a2f1}4、使用jTessBoxEditor矫正.box文件的错误4、使用jTessBoxEditor矫正.box文件的错误 .box文件记录了每个字符在图片上的位置和识别出的内容因为识别出的内容和位置有可能把两个字合到一起或者把一个字拆分了,所以训练前需要使用jTessBoxEditor调整字符的位置和内容。 使用步骤 打开jTessBoxEditor点击Box Editor -Open打开步骤2中生成的“zwp.test.exp0.tif”会自动关联到“zwp.test.exp0.box”文件这两文件要求在同一目录下。调整完点击“save”保存修改。 5、生成fontproperties文件\color{#21a2f1}5、生成font_properties文件5、生成fontp​roperties文件 执行如下命令 echo test 0 0 0 0 0 font_properties 也可以手工新建一个名为font_properties的文本文件输入内容 “test 0 0 0 0 0” 表示字体test的粗体、倾斜等共计5个属性。这里的“test”必须与“zwp.test.exp0.box”中的“test”名称一致。 6、使用tesseract生成.tr训练文件\color{#21a2f1}6、使用tesseract生成.tr训练文件6、使用tesseract生成.tr训练文件 执行下面命令执行完之后会在当前目录生成zwp.test.exp0.tr文件。 执行如下命令 tesseract zwp.test.exp0.tif zwp.test.exp0 nobatch box.train 7、生成字符集文件\color{#21a2f1}7、生成字符集文件7、生成字符集文件 执行下面命令执行完之后会在当前目录生成一个名为“unicharset”的文件。 执行命令 unicharset_extractor zwp.test.exp0.box8、生成shape文件\color{#21a2f1}8、生成shape文件8、生成shape文件 执行下面命令执行完之后会生成 shapetable 和 zwp.unicharset 两个文件。 执行命令 shapeclustering -F font_properties -U unicharset -O zwp.unicharset zwp.test.exp0.tr9、生成聚字符特征文件\color{#21a2f1}9、生成聚字符特征文件9、生成聚字符特征文件 执行下面命令会生成 inttemp、pffmtable、shapetable和zwp.unicharset四个文件。 执行命令 mftraining -F font_properties -U unicharset -O zwp.unicharset zwp.test.exp0.tr10、生成字符正常化特征文件\color{#21a2f1}10、生成字符正常化特征文件10、生成字符正常化特征文件 执行下面命令会生成 normproto 文件。 执行命令 cntraining zwp.test.exp0.tr11、文件重命名\color{#21a2f1}11、文件重命名11、文件重命名 重新命名inttemp、pffmtable、shapetable和normproto这四个文件的名字为[lang].xxx。 这里修改为zwp.inttemp、zwp.pffmtable、zwp.shapetable和zwp.normproto 依次执行下面命令rename normproto zwp.normprotorename inttemp zwp.inttemprename pffmtable zwp.pffmtablerename shapetable zwp.shapetable11、合并训练文件\color{#21a2f1}11、合并训练文件11、合并训练文件 执行下面命令会生成zwp.traineddata文件。 执行命令 combine_tessdata zwp.将生成的“zwp.traineddata”语言包文件复制到 新建文件夹 目录下的tessdata文件夹中就可以使用训练生成的语言包进行图像文字识别了。 12、代码测试\color{#21a2f1}12、代码测试12、代码测试 在pom中引入依赖 !-- pom tess4j相关依赖 --dependencygroupIdnet.sourceforge.tess4j/groupIdartifactIdtess4j/artifactIdversion3.4.0/versionexclusionsexclusiongroupIdcom.sun.jna/groupIdartifactIdjna/artifactId/exclusion/exclusions/dependency代码 public class Main {public static void main(String[] args) {System.out.println(Hello world!);//你的图片 1.png 为我自定义图片名字 其实使用的就是 上面的测试图片File imageFile new File(D:\\OCR\\1.png);//你训练库的路径tessdataITesseract instance new Tesseract();// 模型文件夹必须叫做 tessdatainstance.setDatapath(D:\\OCR\\Test2\\tessdata); // zwp 是刚刚训练过的 包instance.setLanguage(zwp); // chi_sim 是自带的中文包 // instance.setLanguage(chi_sim);String result null;try {result instance.doOCR(imageFile);} catch (TesseractException e) {throw new RuntimeException(e);}System.out.println(result);} }如果网络不行可以下载源码文件进行操作 demo源码 用于配置环境变量,生成.box文件 tesseract-ocr官网 用于调整图片上文字的内容和位置 jTessBoxEditor工具官网 用于设置语言包 instance.setLanguage 其他语言包地址
http://www.hyszgw.com/news/102848.html

相关文章:

  • 九亭做网站网站建设的主要步骤
  • 南宁市网站设计网站开发 ppt
  • 网站需要加wordpress长春建站软件
  • 手机wap网站怎么做windows优化大师和鲁大师
  • 好看的团队官网源码seo推广排名公司
  • 域名哪个网站好内江网站制作
  • 阿里云域名备案网站建设方案站长工具中文
  • 广东省网站建设网站wordpress网易插件
  • aspnet网站开发实例视频猎头公司是干什么的
  • cms傻瓜式建站系统建设一个网站的一般过程
  • 怎么建设卡盟网站网站域名空间多少钱
  • 做企业网站多少钱网站建设与管理的总结报告
  • 什么网站自己做名片好wordpress 自己写
  • 黑龙江省城乡建设厅网站wordpress使用php动态生成下载页
  • seo标题关键词优化优化seo公司哪家好
  • 江苏网站建设案例优设网素材下载
  • 网页设计与网站建设书籍中国建设银行网站在哪上市
  • 模板网站劣势在线自动取名网站怎么做
  • 定制网站建设创意专做脚本的网站
  • 网站沙盒期昆山品牌网站
  • 网站建设浙江九江 网站建设
  • 运城市做网站公司锦州网站开发建设
  • 海口房产网站建设石家庄校园兼职网站建设
  • 怎么才能设计好一个网站怎样开电商平台
  • 网站视频主持人怎么做珠海正规网站制作系统
  • 太原网站优化方案ps 做ui比较好的网站有哪些
  • 小型网站设计师网址导航官网入口
  • 瑞达恒建筑网站陕西百度代理公司
  • 网站公司维护做网站的需要注册商标吗
  • 如何做网站menu菜单西安小程序制作