通過使用百度OCR通用文字識別和iOCR自定義模板文字識別,幫助該鋼鐵物流平臺解決了不同格式鋼材的產品標籤、碼單、甚至有污損標籤的識別,大幅提高了監管覈驗的自動化水平,實現了入庫信息的快速採集,目前該物流已向合作的50餘家鋼廠進行了技術成果推介。
核心訴求
鋼材標籤的分類有數百種之多,由於各種鋼材產品標籤、碼單等格式和條碼等均不統一,通常需要靠手工抄錄鋼材信息,不僅效率低且錯誤率高。某鋼鐵物流平臺希望能夠通過使用通用文字識別技術來進行自動化識別,並且能夠對有污損類標籤進行識別,同時還能結構化產地、規格、品種、牌號、序列號、重量等信息。
解決方案
該物流平臺通過使用百度通用文字識別技術,輕鬆實現了上述訴求,具體實現過程如下:
步驟一:用戶在該物流網內將鋼材標籤進行拍照上傳,網站會先通過圖像質量檢測對圖片質量進行分類,篩選出符合條件的圖片;
步驟二:系統再將這些圖片進行分類,先對有固定版式的圖片直接使用通用文字識別;
步驟三:對於不是固定版式的圖片將通過iOCR自定義模板文字識別+NLP文本矯正,對非標準文檔進行結構化輸出;
步驟四:網站最後將輸出的識別結果返回給用戶。
業務實現流程圖: