Pytorch AttentionOCR 中文端到端的文字識別 程序完全可用
本項目在CRNN的基礎上進行修改完成的,基於Pytorch實現,程序完成可用
整體流程爲:encoder+decoder
encoder採用CNN+biLSTM模型
decoder採用Attention模型
decoder部分主要做不定長文字的識別,和圖像描述很像,就是不定長序列(文字)的生成,所以需要用到RNN。
總體流程
picture | predict reading | confidence |
---|---|---|
美國人不願意與朝鮮人 | 0.33920 | |
現之間的一個分享和 | 0.81095 | |
中國通信學會主辦、《 | 0.90660 | |
此在戰術上應大膽、勇 | 0.57111 | |
年同期俱點83.50 | 0.14481 | |
。留言無惡意心態成 | 0.31054 |
詳細程序在本人github倉庫Attention_ocr.pytorch,預訓練模型,數據集,標註文件都做好了,可以直接下載訓練或者使用,最良心的是推理程序都寫好了,克隆下來就能用。
本人現在在成都一個公司做圖像識別算法工程師,最近想換工作,求有途徑的人內推或介紹一下,或者有公司需要相關的人員的也可以。本人聯繫方式:[email protected]