readme.txt 999 Bytes

Raw Blame History Permalink

SDTR_v1.0:
    功能：对文字切片进行识别, 返回识别结果
    使用方法：
        from SDTR import sdtr
        sdtr.predict(im, boxes)
    输入参数：
        im:opencv下的灰度图
        boxes:numpy矩阵，大小为N*4*2， N为box个数，每个box包含四个坐标（x,y），且坐标顺序必须为：左上，右上，右下，左下
    输出：
        一个字典，包含key:[numpy矩阵box，string识别结果]
        eg. {0: [array([  0,   0, 626,   0, 626,  87,   0,  87]), '陆万壹仟叁佰圆整']}
    环境：
        tensorflow,最好是1.14版本，未在其他版本上测试


    v1.0 2019.09.19
    为CRNN基础
    GPU版本用了CuDNNLSTM, 相比普通LSTM能减少1/2到2/3的时间

    性能：
        购车发票上平均全对率为93.25

        对box缩放到32的高度，一张32*230的图
        GPU时间：15ms
        CPU时间：210ms

        具体性能和box数量和box缩放到32高度时的宽度有关