×

docTR OCR文档文本识别

消耗积分:0 | 格式:zip | 大小:0.39 MB | 2022-05-30

张磊

分享资料个

授权协议 Apache-2.0
开发语言 Python
操作系统 跨平台
软件类型 开源软件

软件简介

由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以无缝访问光学字符识别

获取预训练模型

使用两阶段方法在 docTR 中实现端到端 OCR:文本检测(定位单词),然后文本识别(识别单词中的所有字符)。因此,可以从可用实现列表中选择用于文本检测的架构和用于文本识别的架构。

from doctr.models import ocr_predictor

model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)

读取文件

可以从 PDF 或图像解释文档:

from doctr.io import DocumentFile
# PDF
pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images()
# Image
single_img_doc = DocumentFile.from_images("path/to/your/img.jpg")
# Webpage
webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images()
# Multiple page images
multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])

以默认的预训练模型为例:

from doctr.io import DocumentFile
from doctr.models import ocr_predictor

model = ocr_predictor(pretrained=True)
# PDF
doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images()
# Analyze
result = model(doc)

安装

安装 docTR 需要 Python 3.6(或更高版本)和 pip

由于使用了 weasyprint,如果没有运行在 Linux 系统之上,将需要额外的依赖项。

对于 macOS 用户,可以按如下方式安装它们:

brew install cairo pango gdk-pixbuf libffi

对于 Windows 用户,这些依赖项包含在 GTK 中。

最新版本

可以使用 pypi 安装最新版本的软件包,如下所示:

pip install python-doctr
 

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !