SDTR_v1.0: 功能:对文字切片进行识别, 返回识别结果 使用方法: from SDTR import sdtr sdtr.predict(im, boxes) 输入参数: im:opencv下的灰度图 boxes:numpy矩阵,大小为N*4*2, N为box个数,每个box包含四个坐标(x,y),且坐标顺序必须为:左上,右上,右下,左下 输出: 一个字典,包含key:[numpy矩阵box,string识别结果] eg. {0: [array([ 0, 0, 626, 0, 626, 87, 0, 87]), '陆万壹仟叁佰圆整']} 环境: tensorflow,最好是1.14版本,未在其他版本上测试 v1.0 2019.09.19 为CRNN基础 GPU版本用了CuDNNLSTM, 相比普通LSTM能减少1/2到2/3的时间 性能: 购车发票上平均全对率为93.25 对box缩放到32的高度,一张32*230的图 GPU时间:15ms CPU时间:210ms 具体性能和box数量和box缩放到32高度时的宽度有关
C