readme.txt
999 Bytes
SDTR_v1.0:
功能:对文字切片进行识别, 返回识别结果
使用方法:
from SDTR import sdtr
sdtr.predict(im, boxes)
输入参数:
im:opencv下的灰度图
boxes:numpy矩阵,大小为N*4*2, N为box个数,每个box包含四个坐标(x,y),且坐标顺序必须为:左上,右上,右下,左下
输出:
一个字典,包含key:[numpy矩阵box,string识别结果]
eg. {0: [array([ 0, 0, 626, 0, 626, 87, 0, 87]), '陆万壹仟叁佰圆整']}
环境:
tensorflow,最好是1.14版本,未在其他版本上测试
v1.0 2019.09.19
为CRNN基础
GPU版本用了CuDNNLSTM, 相比普通LSTM能减少1/2到2/3的时间
性能:
购车发票上平均全对率为93.25
对box缩放到32的高度,一张32*230的图
GPU时间:15ms
CPU时间:210ms
具体性能和box数量和box缩放到32高度时的宽度有关