tesseract ocr 中文版
v4.0.0 官方版 发表评论
- 软件类别:文字处理
- 软件大小:41.86 MB
- 更新时间:2018-04-19 13:52
- 软件版本:v4.0.0 官方版
- 软件语言:中文
- 软件等级:
- 官方网址:暂无
评分:
好评:1
差评:1

软件介绍
tesseract-ocr是一款ocr文字识别软件,能够快速将图片文字进行识别提取,从转换成电子文档,tesseract ocr windows常适用于印刷行业;另外国内多种包含ocr技术的软件,例如清华文通、汉王等也都是非常不错的。有需要的朋友欢迎来IT猫扑下载吧。
tesseract ocr中文版平台支持
Tesseract可以在Linux,Windows(用VC++Express或CygWin)和Mac OSX上运行。它也可以在其他平台上编译,包括Android和iPhone,虽然这些都不是行之有效的平台。其他项目也可以用插件页面在各种平台上使用Tesseract。
tesseract ocr安装说明
下载完后进行安装,默认情况下安装程序会给你配置系统环境变量,以指向安装目录(之后可以通过DOS界面在任意目录运行tesseract)。

tessdata 目录存放的是语言字库文件,和在命令行界面中可能用到的参数所对应的文件. 这个安装程序默认包含了英文字库。
使用Tessract-OCR引擎识别验证码
打开DOS界面,输入tesseract:

如果出现如上输出,表示安装正常。
我准备了一张验证码code.jpg
放在D盘根目录下


附录:
Usage:tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
pagesegmode values are:
0 = Orientation and script detection (OSD) only.
1 = Automatic page segmentation with OSD.
2 = Automatic page segmentation, but no OSD, or OCR
3 = Fully automatic page segmentation, but no OSD. (Default)
4 = Assume a single column of text of variable sizes.
5 = Assume a single uniform block of vertically aligned text.
6 = Assume a single uniform block of text.
7 = Treat the image as a single text line.
8 = Treat the image as a single word.
9 = Treat the image as a single word in a circle.
10 = Treat the image as a single character.
-l lang and/or -psm pagesegmode must occur before anyconfigfile.
tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
tesseract 图片名 输出文件名 -l 字库文件 -psm pagesegmode 配置文件
例如:
tesseract code.jpg result -l chi_sim -psm 7 nobatch
-l chi_sim 表示用简体中文字库(需要下载中文字库文件,解压后,存放到tessdata目录下去,字库文件扩展名为 .raineddata 简体中文字库文件名为: chi_sim.traineddata)
-psm 7 表示告诉tesseract code.jpg图片是一行文本 这个参数可以减少识别错误率. 默认为 3
configfile 参数值为tessdataconfigs 和 tessdatatessconfigs 目录下的文件名
核心开发
核心开发人员是Ray Smith。
在相关工作中,Thomas Breuel(tmbdev)和Ilya Mezhirov (mezhirov)开发了OCRopus项目,该项目还提供了布局分析和统计语言建模的工作。
Tesseract的大部分运作由谷歌赞助。
多平台下载
Pc版tesseract ocr 中文版 v4.0.0 官方版
猜你喜欢
ocr文字识别软件

ocr文字识别软件
ocr文字识别软件是在工作中经常会使用到的文档快速识别工具,特别是从事文档处理工作的用户每天都需要大量的处理文档文件。如果全部使用人工编辑输入是非常浪费时间的,此时您就可以使用这类OCR文档识别工具,您只需要扫描一下就能将您需要处理的文字快速处理,欢迎您到IT猫扑下载。...
本类推荐
本类最新
Typora编辑器电脑版6.4
批量图像转文字
信息数据恢复软件v1.0.6 安卓版
存储空间清理app最新版本v5.1.4 安卓官方版
文件转换免费软件v1.0.7 安卓版
ds文件管理器appv1.2.7 安卓版
123云盘官方版v2.3.18 安卓版
傲软pdf编辑器v5.4.1.10118 官方版
pdf annotator支持手写笔v9.0.0.912 官方正式版
Master PDF Editor编辑器5.9.35中文绿色便携版
讯飞文档电脑版v2.1.1130 官方版
天若文字识别专业版v1.3.7 免费开源最终版
寒时文档大师v2.0.6.27 绿色版
万兴pdf专家正版v9.1.3.1957 中文官方pc版
005微信编辑器v1.0 官方免费版
相关软件
coco文字识别软件v1.0.0.1 官网免安装版coco文字识别软件是一款能将图片转换成文字的软件,功能很实用,支持快捷方式截图,快速截取图像,方便实用,需要的朋友快来IT猫扑下载使用吧!软件功能本软件,优于市面上所有图像文字转换文本文字软件的,最大特征。本软件支持快捷
readiris corporate 16简体中文版v16.0 汉化免费版readiriscorporate16破解版是一款优秀的办公使用的ocr文字识别软件,在企业办公中经常是需要使用到文字识别软件的,能够让您在对文章整理时更加快速和方便,欢迎您到IT猫扑下载。readiriscorporate16破解版安装说明1、下载
CoCo图像转换成word文字识别工具绿色特别版coco图像识别破解版是一款超级好用的文字识别转换软件,可以直接提取图像上的文字信息,快速转换为文本形式,有需要的用户欢迎来IT猫扑下载~CoCo图像转换成word文字识别工具简介CoCo图像识别工具是一款非常强的文字识别
汉王OCR文字识别软件v6.0 中文破解版汉王ocr6.0破解版是小编分享的一款免费图片转换文字的软件,也就是大家说的文字识别软件,使用汉王6.0可以帮你快速识别文字,再也不用人工手打输入啦,工作效率可以提高很多,快来IT猫扑下载吧!汉王OCR文字识别软件介绍很多企事
下载排行
- 1汉王OCR文字识别软件
- 2福昕高级pdf编辑器企业版
- 3emeditor注册密钥
- 4acrobat xi pro注册机
- 5GridinSoft CHM Editor已激活版
- 6汉王文豪7600免费版
- 7Adobe Acrobat XI Pro绿色版
- 8汉王OCR汉字表格识别系统
- 9清华紫光th ocr(文字识别软件)
- 10pdf转AutoCAD文件(pdf2cad)







Notepad2
editplus 64位破解版
超强ocr文字识别软件
gidot typesetter排版助手
文件字符替换器
EmEditor Professional32位+64位(文本编辑器)
捷速pdf编辑器注册版
PDF去水印工具(softorbits pdf logo remover)








网友评论
查看所有0条评论