Graccvs---文件正文提取开发组件
    Graccvs开发组件为Lucene/CLucene, Elasticsearch, Sphinx等全文检索工具,OA, ERP, CRM,网盘,文件管理等其他系统提供文件摘要及搜索前置服务。可以为安全网关,邮件内容监控,内网安全等系统提供文件搜索及监控服务底层技术支持。
    本组件全部用go语言实现,不依赖外部工具,效率高,安全性非常好。可以直接在操作系统上使用,速度快,质量高,跨平台,支持多任务并发,开发简单成本低。提供多种语言接口及使用示例。
    组件可以提取pdf,office(doc,xls,ppt,docx,xlsx,pptx),wps,rtf,开放文档格式 ofd,HTML(html,htm,mht,mhtml),邮件格式文件 eml,思维导图(emmx,xmind,gmind), 帮助文件chm,压缩文件 zip,UTF8编码, Unicode编码, Ansi编码的文本文件(txt, c, h, cpp, asp, aspx......) 。
    Windows(32bit和64bit),Linux (64bit),Android,苹果ios操作系统,提供 VC,GCC,JAVA,C#,Delphi,Android Java,苹果ios Objective-C调用示例。
接口详细介绍        下载
  简可信---模板OCR识别工具
    “简可信”是一款高效易用、识别率高、安全可靠、支持批量操作的区域定向识别专用软件系统。软件设计采用了超前的处理理念、先进的文字识别技术,更高效地实现了对各类票据、合同、证件等标准化文档进行扫描识别并生成结构化数据,是扫描文件和结构化数据的转化桥梁,是文件管理和数据统计得力助手,是扫描工厂、打印社的不可缺少的专业工具。
  • 各种证件关键信息的定向识别
  • 发票扫描、高拍仪关键信息识别
  • 可以自编辑模板工具,批量识别
  • TIFF,JPG,BPM,PSD,PNG,GIF等关键信息识别
  • 图片关键信息识别生成JSON数据
  • 可以导出双层PDF、图片文本逐行PDF、TIFF格式
  • 各种合同扫描件关键信息识别
  • PDF文件OCR信息识别
  • 可以定义多页模板,不同页套用不同模板
  • 图片、扫描件、高拍仪转化为PDF文件
  • 各种图片转PDF文件
  • PDF正文提取
详细图示及介绍        下载免费版本
  PDF,图片批量OCR识别工具
     可以同时对大量PDF文档,图片文件进行OCR识别。将您的图片文档,PDF文件转换为可编辑的文本,可以批量输出双层PDF,文本文件等。 软件使用Tesseract5 API, 速度快,质量高,支持多线程处理。
      本系统可以实现内网环境下本地化部署,不需要把文件上传到互联网,可以保障文件安全,不会导致泄密。
      软件完全免费,没有任何时间和功能限制。
下载软件
  企业文件管理系统
    文件管理系统帮助企业完成电子文件集中管理、权限控制、协同文件处理的综合办公平台,是性能效率高、部署维护简单的低成本高性价比信息化系统,是企业数字资产管理的利器。
    模板OCR识别工具生成的文件可以直接批量上传到本系统进行管理,实现全文检索,在线预览等等操作...
  • 轻量级架构,自助型部署
  • TB级海量文档集中存储管理
  • 文件加密存储、多硬盘支持
  • LDAP、Windows AD域用户集成、RTX集成
  • 企业微信、钉钉用户集成登录
  • 支持SSL加密传输(HTTPS)
  • 支持移动端,提供安卓、苹果APP
  • 强大的全文检索支持毫秒级检索
  • OFFICE、PDF等在线预览,修改协同工作
  • HTML5、控件方式预览Office和PDF文件
  • 支持超过500多种各种文档的在线预览
  • 支持超大文件的自动上传、剪切板粘贴上传
  • 文件审核机制,是工程文件管理更安全可靠
  • 文档外链发布,交流更方便
详细图示及介绍        下载试用