接下来,江寒又设计了一个抠图算法。
在实际应用中,原始文件以打印稿的扫描件为主,图片质量参差不齐。
所以在识别之前,一般要做些预处理,例如:矫正文本位置、去噪声、二值化等等。
具体的说,先要分析图像的光照特性,获取光照分布MAP。
然后进行边缘分析,得到图像的边缘分布模型,得到总边缘权值A。
接下来,再计算出图像的模糊程度,得到图像模糊度权值B。
这样就可以利用MAP、A、B这些参数,对图像进行二值化。
此外还要填充空白,防止图像产生断裂,并对离散的点进行分析,排除噪声点……
预处理完毕,才能把图片切割成一个个小块。
切割的时候,先对图片进行水平投影,找到每一行的上界和下界,将原始图片切成一行、一行。
再对切割出来的每一行进行垂直投影,找到每一个字符的左右边界,切割成一个、一个字符。
切割出来的一个个小块中,只允许包含一个字符。
此外还要对这些小图块进行缩放处理,有需要的时候还要进行对齐处理,最后才能送进集成式神经网络进行识别。
中午时间只有1个多小时,自然做不完这么多事,时间差不多了,江寒就叫醒夏雨菲,一起去上学。
然后整个下午,他都在研究《原子物理》,晚上回家吃完饭之后,就回到自己房间继续写代码。
忙到晚上9点多,终于搞定了大部分程序。
至于那些神经网络,则还需要一段时间进行训练。
看看时间不早了,江寒就将目前的工作备了个份,然后洗澡、上床、睡觉。
说是睡觉,其实是打算进入虚拟空间,愉快地玩耍一番。
然而他刚钻进被窝,就有人敲响了房门。
Loading...
未加载完,尝试【刷新网页】or【关闭小说模式】or【关闭广告屏蔽】。
使用【Firefox浏览器】or【Chrome谷歌浏览器】打开并收藏!
移动流量偶尔打不开,可以切换电信、联通网络。
收藏网址:www.sisiread.com
(>人<;)