您好!欢迎来到北极熊网

北极熊网

热门搜索: 任正非传    神雕侠侣    红楼梦   

python:超简单的字符分割算法(车牌识别、仪表识别等)

  • 时间:2021-09-24 21:48 编辑:佚名 来源:北极熊 阅读:127
  • 扫一扫,手机访问
摘要:文章目录背景图像预处理确定字符区域分割单个字符完整源码结语背景在诸如车牌识别,数字仪表识别等问题中,最关键的就是将单个的字符分割开来再分别进行识别,如下图。最近刚好用到,就自己写了一个简单地算法进行字符分割,来记录一下。图像预处理彩图二值化以减小参数量,再进行腐蚀膨胀去除噪点。image = cv2.imread('F://demo.jpg', 0)  # 读取为灰度图_, image = cv2.thresh

文章目录

背景

图像预处理

确定字符区域

分割单个字符

完整源码

结语

背景

在诸如车牌识别,数字仪表识别等问题中,最关键的就是将单个的字符分割开来再分别进行识别,如下图。最近刚好用到,就自己写了一个简单地算法进行字符分割,来记录一下。

在这里插入图片描述



图像预处理

彩图二值化以减小参数量,再进行腐蚀膨胀去除噪点。


image = cv2.imread('F://demo.jpg', 0)  # 读取为灰度图

_, image = cv2.threshold(image, 50, 255, cv2.THRESH_BINARY)  # 二值化

kernel1 = cv2.getStructuringElement(cv2.MORPH_RECT, (7, 7))  # 腐蚀膨胀核

kernel2 = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))  # 腐蚀膨胀核

image = cv2.erode(image, kernel=kernel1)  # 腐蚀

image = cv2.dilate(image, kernel=kernel2)  # 膨胀

在这里插入图片描述



确定字符区域

考虑最理想的情况,图中的字符是端正没有倾斜歪曲的。将像素灰度矩阵分别进行列相加、行相加,则在得到的列和、行和数组中第一个非 0 元素索引到最后一个非 0 元素索引包裹的区间即就是字符区域。


h, w = image.shape  # 原图的高和宽

list1 = []  # 列和

list2 = []  # 行和


for i in range(w):

    list1.append(1 if image[:, i].sum() != 0 else 0)  # 列求和,不为0置1

for i in range(h):

    list2.append(1 if image[i, :].sum() != 0 else 0)  # 行求和,不为0置1


# 裁剪字符区域

# 求行的范围

flag = 0

for i, e in enumerate(list1):

    if e != 0:

        if flag == 0:  # 第一个不为0的位置记录

            start_w = i

            flag = 1

        else:  # 最后一个不为0的位置

            end_w = i

# 求列的范围

flag = 0

for i, e in enumerate(list2):

    if e != 0:

        if flag == 0:  # 第一个不为0的位置记录

            start_h = i

            flag = 1

        else:  # 最后一个不为0的位置

            end_h = i


print(start_w, end_w)  # 行索引范围

print(start_h, end_h)  # 列索引范围


在这里插入图片描述


分割单个字符

与分割全部字符区域同理,在行和数组中非 0 元素索引的范围即是单个字符的区域。


l = ([i for i, e in enumerate(list1) if e != 0])  # 列和列表中不为0的索引

img_list = []  # 分割数字图片存储列表

temp = []  # 存储某一个数字的所有行索引值

n = 0  # 数字图片数量


for x in l:

    temp.append(x)

    if x+1 not in l:  # 索引不连续的情况

        if len(temp) != 1:

            start_w = min(temp)  # 索引最小值

            end_w = max(temp)  # 索引最大值

            img_list.append(image[start_h:end_h, start_w:end_w])  # 对该索引包括数字切片

            n += 1

        temp = []


print(n)  # 字符数




完整源码

import cv2


start_h, end_h, start_w, end_w = 0, 0, 0, 0  # 字符区域的高和宽起止


image = cv2.imread('F://001_1.jpg', 0)  # 直接读取为灰度图

cv2.imshow('img_GRAY', image)


_, image = cv2.threshold(image, 50, 255, cv2.THRESH_BINARY)  # 二值化

cv2.imshow('img_BINARY', image)


# 去噪点

kernel1 = cv2.getStructuringElement(cv2.MORPH_RECT, (7, 7))  # 简单腐蚀膨胀核

kernel2 = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))  # 简单腐蚀膨胀核

image = cv2.erode(image, kernel=kernel1)  # 腐蚀

image = cv2.dilate(image, kernel=kernel2)  # 膨胀

cv2.imshow('img_denoise', image)



h, w = image.shape  # 原图的高和宽

# print(h, w)


list1 = []  # 列和

list2 = []  # 行和


for i in range(w):

    list1.append(1 if image[:, i].sum() != 0 else 0)  # 列求和,不为0置1

for i in range(h):

    list2.append(1 if image[i, :].sum() != 0 else 0)  # 行求和,不为0置1


# print(len(list1))

# print(len(list2))


# 裁剪字符区域

# 求行的范围

flag = 0

for i, e in enumerate(list1):

    if e != 0:

        if flag == 0:  # 第一个不为0的位置记录

            start_w = i

            flag = 1

        else:  # 最后一个不为0的位置

            end_w = i

# 求列的范围

flag = 0

for i, e in enumerate(list2):

    if e != 0:

        if flag == 0:  # 第一个不为0的位置记录

            start_h = i

            flag = 1

        else:  # 最后一个不为0的位置

            end_h = i


print(start_w, end_w)  # 行索引范围

print(start_h, end_h)  # 列索引范围


cv2.imshow('img_number', image[start_h:end_h, start_w:end_w])


l = ([i for i, e in enumerate(list1) if e != 0])  # 列和列表中不为0的索引

# print(l)


img_list = []  # 分割数字图片存储列表


temp = []  # 存储某一个数字的所有行索引值

n = 0  # 数字图片数量

for x in l:

    temp.append(x)

    if x+1 not in l:  # 索引不连续的情况

        if len(temp) != 1:

            start_w = min(temp)  # 索引最小值

            end_w = max(temp)  # 索引最大值

            img_list.append(image[start_h:end_h, start_w:end_w])  # 对该索引包括数字切片

            n += 1

            # print(temp)

        temp = []


print(n)  # 字符数


for i in range(n):  # 显示保存字符

    cv2.imshow('number'+str(i), img_list[i])

    cv2.imwrite('F://demo'+str(i+1).zfill(2)+'.jpg', img_list[i])


cv2.waitKey(0)

————————————————

  • 全部评论(0)
上一篇:已是第一篇内容
下一篇:尤雨溪: Vite 会取代 vue-cli 吗?
资讯详情页最新发布上方横幅
最新发布的资讯信息
【今日头条|头条】当代的丑态丛生,资本已经到了无耻地步(2021-11-20 23:44)
【今日头条|头条】搜狐视频会员 2021年11月17日更新第4批 小爸爸搜狐视频,搜狐视频大视野,为什么艾九影视看不了火影忍者?(2021-11-18 12:03)
【程序人生|Python】Python 之父:Python 4.0 可能不会来了(2021-11-10 22:48)
【今日头条|头条】低代码发展正当时,中国有望超过美国成为全球低代码开发领域的领导者(2021-11-03 21:32)
【今日头条|头条】网盘免费下载速度慢?有好消息了(2021-11-02 21:07)
【今日头条|头条】尽快卸载这两款恶意浏览器插件!已有近50万用户安装(2021-11-01 20:52)
【今日头条|头条】都2021年了,这个国家一半电脑还在使用Windows XP(2021-10-30 22:51)
【技术文档|架构】一个轻量级、高性能的 C++ Web 框架(2021-10-30 21:02)
【程序人生|Python】10分钟教你搭建一个好玩的Python全文搜索引擎(2021-10-28 21:36)
【今日头条|前沿科技】Safari浏览器正在杀死Web(2021-10-27 19:54)
联系我们
电话:18936411277
邮箱:1044412291@qq.com
时间:09:00 - 19:00
公众号:北格软件
底部广告