GitHub：开源易用的中文离线OCR

Z时代
2024-01-10
分类：技术分享

hello，小伙伴们大家好，今天给大家推荐的开源项目是：TrWebOCR,开源易用的中文离线OCR，识别率媲美大厂，并且提供了易用的web页面及web的接口，方便人类日常工作使用或者其他程序来调用~

效果展示

特性

中文识别快速高识别率

文字检测支持一定角度的旋转

并发请求由于模型本身不支持并发，但通过tornado多进程的方式，能支持一定数量的并发请求。具体并发数取决于机器的配置。

安装需求

平台

✔ Python 3.6+

✔ Ubuntu 16.04

✔ Ubuntu 18.04

✔ CentOS 7

✔ Docker

Windows和MacOS系统下可通过构建Docker镜像来使用，暂不支持直接部署使用其他Linux平台暂未测试，可自行安装测试。

最低配置要求

CPU: 1核

内存: 2G

SWAP: 2G

安装部署

服务器部署

1、下载项目，并进入改项目文件下

$ git clone https://github.com/alisen39/TrWebOCR.git $ cd TrWebOCR/

2、安装项目

$ python install.py

3、安装依赖包

$ pip install -r requirements.txt

4、启动

python backend/main.py

项目默认运行在8089端口，看到以下输出则代表运行成功：

# tr 1.5.0 https://github.com/myhub/tr server is running: 0.0.0.0:8089

Docker部署

1、从 Dockerfile 构建或者直接 Pull镜像

# dockerfile 构建 docker build -t trwebocr:latest .

# 从 dockerhub pull docker pull mmmz/trwebocr:latest

2、Docker run

docker run -itd -p 8089:8089 --name trwebocr trwebocr:latest

这里把容器的8089端口映射到了物理机的8089上，但如果你不喜欢映射，去掉run后面的-p 8089:8089 也可以使用docker的IP加8089来访问

接口调用示例

Python 使用File上传文件

import requests
url = 'http://192.168.31.108:8089/api/tr-run/'
img1_file = {
'file': open('img1.png', 'rb')
}
res = requests.post(url=url, data={'compress': 0}, files=img1_file)

开源地址：github.com/alisen39/Tr…

今天的推荐不知道大家喜不喜欢？如果大家喜欢话，请在文章底部留言或点赞，以表示对我的支持，你们的留言，点赞，转发关注是我持续更新的动力，peace！

关注公众号回复："1024"，免费领取一大波学习资源，先到先得哦！

以上是 GitHub：开源易用的中文离线OCR 的全部内容，来源链接： utcz.com/a/25278.html