說明
1、PaddleOCR是基于深度學(xué)習(xí)的ocr識(shí)別庫,中文識(shí)別精度相當(dāng)還不錯(cuò),能夠應(yīng)對大多數(shù)文字提取需求。
2、需要依次安裝三個(gè)依賴庫,shapely庫可能會(huì)受到系統(tǒng)的影響,出現(xiàn)安裝錯(cuò)誤。
安裝命令
pip install paddlepaddle
pip install shapely
pip install paddleocr
代碼實(shí)現(xiàn)
ocr = PaddleOCR(use_angle_cls=True,)
# 輸入待識(shí)別圖片路徑
img_path = r"d:\Desktop\4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png"
# 輸出結(jié)果保存路徑
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores)
im_show = Image.fromarray(im_show)
im_show.show()
內(nèi)容擴(kuò)展:
簡介
PaddleOCR旨在打造一套豐富、領(lǐng)先、且實(shí)用的OCR工具庫,助力使用者訓(xùn)練出更好的模型,并應(yīng)用落地。
近期更新
- 2020.8.26 更新OCR相關(guān)的84個(gè)常見問題及解答,具體參考FAQ
- 2020.8.24 支持通過whl包安裝使用PaddleOCR,具體參考Paddleocr Package使用說明
- 2020.8.21 更新8月18日B站直播課回放和PPT,課節(jié)2,易學(xué)易用的OCR工具大禮包,獲取地址
- 2020.8.16 開源文本檢測算法SAST和文本識(shí)別算法SRN
- 2020.7.23 發(fā)布7月21日B站直播課回放和PPT,課節(jié)1,PaddleOCR開源大禮包全面解讀,獲取地址
- 2020.7.15 添加基于EasyEdge和Paddle-Lite的移動(dòng)端DEMO,支持iOS和Android系統(tǒng)
特性
- 超輕量級中文OCR模型,總模型僅8.6M
- 單模型支持中英文數(shù)字組合識(shí)別、豎排文本識(shí)別、長文本識(shí)別
- 檢測模型DB(4.1M)+識(shí)別模型CRNN(4.5M)
- 實(shí)用通用中文OCR模型
- 多種預(yù)測推理部署方案,包括服務(wù)部署和端側(cè)部署
- 多種文本檢測訓(xùn)練算法,EAST、DB、SAST
- 多種文本識(shí)別訓(xùn)練算法,Rosetta、CRNN、STAR-Net、RARE、SRN
- 可運(yùn)行于Linux、Windows、MacOS等多種系統(tǒng)
到此這篇關(guān)于python PaddleOCR庫用法及知識(shí)點(diǎn)詳解的文章就介紹到這了,更多相關(guān)python PaddleOCR庫的介紹內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- python3使用Pillow、tesseract-ocr與pytesseract模塊的圖片識(shí)別的方法
- python3光學(xué)字符識(shí)別模塊tesserocr與pytesseract的使用詳解
- python EasyOCR庫實(shí)例用法介紹
- python muggle_ocr庫用法及實(shí)例代碼
- python 如何做一個(gè)識(shí)別率百分百的OCR
- Python 實(shí)現(xiàn)任意區(qū)域文字識(shí)別(OCR)操作
- Python實(shí)現(xiàn)OCR識(shí)別之pytesseract案例詳解