计算机视觉检测技术范例(12篇)

来源:其他

计算机视觉检测技术范文篇1

关键词:数字图像图像技术机械零件测量

中图分类号:TP391.41文献标识码:A文章编号:1672-3791(2016)09(b)-0016-02

由于我国数字图像处理技术的快速发展,在机械测量中取代了传统利用卡尺测量的方法。数字图像处理在机械零件测量中的应用,使测量工作的效率得到了有效提高,最大程度地保证了检测任务能及时、高效完成。机械零件测量的速度和精度是机器视觉所强调的,大大提高了工业现场的可靠性。通过数字图像处理技术测量机械零件,有利于提高零件的精度和准确度。

1图像测量系统

光源、计算机、CCD相机、传感器、支架、零件移动平台等各个部件是图像测量系统的主要组成部分。图像测量系统原理图如图1所示。

机械零件的图像通过CCD相机获取,再利用计算机图像测量系统对所获取的图像进行预处理,使用测量软件测量机械零件的图像。由于受现场各种因素的影响,如受照明条件的影响,容易影响现场机械零件测量的精度。在此条件下,就要求测量人员对影响测量机械零件精度的因素进行处理,在现场采用环形光源,有利于避免机械零件产生阴影,影响测量精度。此外,环形光源的使用。使光线与机械零件近似垂直,使机械零件在环形光源的照射下更加明亮,便于分割零件图像,从而提高机械零件的测量精度。此外,在测量机械零件过程中,有的机械零件较大,导致CCD相机无法一次获取全部数据,这就要求使用双重坐标系来测量,双重坐标系是由面阵CCD相机和高精度的计量光栅单元共同组成的。由双重坐标系采用轮廓跟踪的方式进行检测,从而对机械零件的实际位置进行确定,进而提高机械零件的测量精度。

2机器视觉技术在机械零件测量中的应用

2.1利用机器视觉技术对机械零件进行精密测量

由CCD摄像头、计算机处理系统和光学系统共同组成了图像检测系统。图像检测系统的工作原理是先用平行光束照射待检测的机械零件表面,光源利用反射光,将机械零件的轮廓利用光学显微镜进行放大,然后将放大后的机械零件通过CCD摄像头使其成为图像,在计算机处理系统中输入成像后的数据,并对数据进行分析,从而对机械零件的定位进行精准测量。此外,在针对机械零件获取位移量的问题上,先移动需要检测的机械零件,对数据进行测量,再按上述方式对机械零件再测量一次,机械零件的位移量就是两次测量结果之差。在测量过程中,如果被测量的机械零件的两次轮廓线出现在同一个成像位置,该轮廓线的实际尺寸就是该机械零件的位移量。对于体积小、形状简单和生产数量多的机械零件使用此种方式检测具有明显的优势。

2.2利用机器视觉技术对机械零件进行预调测量

利用光学投影对机械零件进行定位是传统的机械零件预调测量方式,通过光栅数显表将测量数据显示出来,但是此种方法要求相关测量人员具有较高的专业技术水平,此外在此种方式的使用上需要投入大量的人力,造成人力资源分配不合理的现象,阻碍了工作效率的提高。针对此种现象,新式预调测量仪在专业人士的创建改善后被应用到机械零件预调测量的工作中。新式预调测量仪,在传统的光栅测量技术的基础上,对机器视觉技术、计算机处理技术和机器自动控制技术等相关技术进行引进。这些先进技术的引进,对传统的机械零件预调测量模式进行改善,机械零件的光栅测量技术与机器视觉技术相结合的新式预调测量仪的应用,优化了操作流程,提高了工作效率,在提高机械零件测量精度方面也有十分显著的效果。

2.3利用机器视觉技术对机械零件进行逆向测量

以三角法为基础,把机器视觉技术应用在逆向工程机械零件的测量中,对机械零件表面轮廓利用应用线结构光进行测量,是快速轮廓视觉测量技术。在机械零件的测量表面投射平面条纹结构光,使测量表面在光的照射下产生不同形状的条纹,从而开展机械零件表面的分析工作。此外,在摄取机械零件表面条纹的图像时,必须把经过视频信号的CCD摄像头转化到模拟信号模式,再进行模拟信号转化数字信号的工作,在此工作完成之后对所得数据进行保存,最后用计算机处理系统对所得图像进行处理,得出机械零件模型图,从而对机械零件进行测量。

3结语

机器视觉技术和数字图像处理技术的快速发展,使其在机械零件的测量中得到了广泛的应用。该文从图像测量系统、机器视觉技术在机械零件测量中的应用两方面进行分析,得出数字图像处理技术具有工作效率高、测量结果精度高、可靠性强、节省人力资源且有实时性等特点。在测量机械零件的工作中使用数字图像处理技术为我国工业的进一步发展奠定了基础。

参考文献

[1]李婧,黄进.一种图像测量中的快速中值滤波算法[J].微计算机信息,2014,23(21):299-300,310.

[2]祝中秋,李斌.基于直方图拉伸的图像增强算法及其实现[J].信息技术,2009(5):54-57.

[3]高守传,姚领田.VisualC++实践与提高数字图像处理与工程应用篇[M].北京:铁道出版社,2006.

[4]马驰,张红云,苗夺谦,等.改进的多阈值动态二值化算法[J].计算机工程,2006,32(6):203-205.

计算机视觉检测技术范文篇2

Abstract:Surfacedefectdetectionisanessentialandimportantlinkinthesystemtoensurethequalityoftheproducts.Surfacedetectiontechnologybasedonmachinevisionimagingmethodhasbecomeameansofreformonlinesurfaceinspection.Thispaperanalyzesthemeansofdetection,andgivesthemethodstoresearchLEDlightsourcedesign,surfacedefectvisualimaging.

关键词:表面缺陷检测;视觉检测;LED光源

Keywords:surfacedefectdetection;visualinspection;LEDlightsource

中图分类号:TP391文献标识码:A文章编号:1006-4311(2014)16-0057-02

0引言

机器视觉检测技术是用视觉传感器和计算机组成的采集与控制系统对被测对象进行成像,再利用图像处理技术提取被测量信息的测量技术。机器视觉检测系统通常由视觉传感器、计算机采集与控制、图像处理三大模块组成,其中视觉传感器是由特定的照明光源和成像器件组成。在机器视觉表面缺陷检测量方法上关键要解决照明方法与成像方法两个问题。

1LED光源照明的打光技巧与LED光源模组设计分析

在视觉检测中,LED光源的设计,是实现正确打光技巧的前题。打光方法是否合理关系到目标信息是否能准确的摄取。因此,LED光源设计与打光技巧是视觉检测中的关键问题。

首先在理论上解决以下两个问题:一是明场照明与暗场照明、直接照明与散射照明、倾斜照明与同轴照明、投射照明、偏振照明等照明方式同表面粗糙度和表面特征之间的关系;二是照面光源的色温和光谱特性同目标特征的颜色以及背景颜色之间的互补关系,以及光谱与色温对目标特征增强的影响规律。

然后以光的反射、散射等物理光学及光度学为理论基础,以LightTools和TracePro为光源设计工具软件,结合图1对LED光源的要求,研究LED光源照明的打光技巧和LED光源的设计原理和方法。

2表面缺陷视觉在线检测中大孔径远心光路成像技术分析

不论是点扫描成像、线扫描成像还是帧成像,通常在图像传感器的前方需要放置一个物镜,在特定的照明方式下,在特定的空间位置,把含有表面缺陷信息的散射光场汇聚到图像传感器的感光面上。由于成像物镜一般都有有限的孔径,在近几年的研究中发现,这种小孔径视觉成像,在大面积表面缺陷测量中,对很多缺陷不敏感,要解决这个问题,需要研究采用大孔径远心光路成像。而在大面积表面缺陷检测中,大孔径远心光路系统又很难实现。

以往的研究中发现用线阵扫描方法或面阵摄像机直接对被测表面成像时,即使摄像机的分辨率很高,有时都难以分辨表面上的微观缺陷,主要原因是摄像机镜头的孔径大小改变了光线的传播方向。为了解决这个问题,只有让散射光场中的光线平行地投射到感光面上,即采用远心光路系统。图1给出了高速线阵扫描的两种可能的视觉成像方式。

3表面缺陷计算机自动识别技术分析

采用计算机从视觉图像中自动识别表面缺陷,在理论上与实际应用中一直都是一个非常难的问题,尤其是复杂背景的视觉图像中表面缺陷的自动识别。这通常是表面缺陷在线检测中的一个主要瓶颈。不过近些年来,随着数学形态学、计算机纹理分析技术与模式识别技术的发展,各种新的自动识别方法不断出现,为表面缺陷的自动识别在理论与方法上提供了很好的支持。

目前研究工作中,常用的途径是采用数学形态学与纹理分析等分类法。如Anand等人对焊接的缺陷图像首先利用Canny算子探测出缺陷的边界,再用膨胀法连接哪些相似的边界,用腐蚀去除掉哪些不相干的边界,最后根据缺陷的特性进行分类。Chetverikov等人在视觉检测具有规则纹理结构表面的缺陷时,采用形态学对纹理中的缺陷进行增强,然后根据纹理的规则性与局部方向性把缺陷从纹理图像中分离出来。

可以分析得出,将数学形态学与计算机纹理分析技术结合起来,进行表面缺陷的自动识别技术研究将是一种可行的方法。形态学方法一般比较适合用于表面缺陷视觉图像的前期处理,因为用它对缺陷图像进行变换,可以增强表面缺陷的特征,但是它难以单独完成缺陷的自动识别任务。纹理分类有四大种类,每个种类有许多不同的分类方法,利用纹理中的特征值或函数,可以完成图像自动识别。但是在纹理分类法中,目前现有的分类方法对复杂的纹理图像识别精度不是很高,有时难以胜任表面缺陷在线自动检测的需要。因此如果把形态学方法与纹理分类法结合起来,也许是一条比较好的提高自动识别精度的途径。

参考文献:

[1]A.Anand,P.Kumar,“Flawdetectioninradiographicweldimagesusingmorphologicalapproach,”NDT&EInternational,Vol.39,2006:29-23.

[2]D.Chetverikov,A.Hanbury,“Findingdefectsintextureusingregularityandlocalorientation,”PatternRecognition,Vol.35,2002:2165-2180.

计算机视觉检测技术范文1篇3

关键词机器视觉;差分;Otsu法;阈值分割

中图分类号TP39文献标识码A文章编号1674-6708(2013)103-0210-03

0引言

目前,某些需要二十四小时严禁物体移动或者非法入侵的监控区域通常采用传统的主动红外对射探测器和监控摄像机来实现场景变化检测及录像功能。但上述组合存在很多难以解决的缺陷,探测器的安装高度影响探测精度,太低容易误报,太高则易漏报,而且极易遭到破坏而失去其功效等。反观图像本身的信息量非常大,远超过红外探测器所需要的,故采用机器视觉技术在现有的监控摄像机基础上就可以实现动态检测的功能。而且摄像机有很好的隐蔽性和监控范围大等特点可以较好地解决传统组合自身的缺陷。

机器视觉是利用计算机对视频(数字图像)进行有效的处理,识别满足相应条件的数字图像。OpenCV是一个基于(开源)发行的跨平台计算机视觉库,它有一系列C函数和少量的C++类构成,轻量级而且高效地实现了图像处理和计算机视觉方面的很多算法。可以说基于OpenCV的机器视觉技术让摄像机有了认知能力,能够轻松准确地发现监控区域的动态变化。

1动态检测

对监控区域内物体的运动进行检测即为动态检测。本文在基于OpenCV2.4.3和VisualStudio2010环境下利用动态检测原理实现动态检测功能。其步骤为(以火燃烧过程为例):

1)从摄像机获取视频流并显示在对应控件上;

2)从视频流抓取背景帧A和设定的固定时间后的前景帧B,如图1所示;

对两帧做灰度化处理,即将RGB图转换为Gray图,如图2所示。

3)判断两帧灰度化后结果是否一致:一致说明监控区域无异常,返回到2);否则说明监控区域有异常,需继续进行判断;

4)用灰度化后的前景与背景帧做差分,如图3所示。并对差分结果进行阈值分割。差分是取前、背景中所对应的每一个像素点灰度值差的绝对值,阈值分割则将绝对值大于分割阈值的像素点置为1,即白点,反之即为0。可以看出,阈值的选取影响了最终判定异常区域的大小,而且随着监控区域光线的变化等因素影响,阈值应是介于0与255之间的一个自适应的动态变化值。

这里采用Otsu法,也称最大类间方差法,它的主要思想是按照灰度特性将图像划分为背景和目标两部分,划分依据为选取门限值,使得背景和目标之间的方差最大(背景和目标之间的类间方差越大,说明这两部分的差别越大,当部分目标被错划分为背景或部分背景错划分为目标都会导致这两部分差别变小。因此,使用类间方差最大的分割意味着错分概率最小)。其主要的实现原理为如下:

(1)建立图像灰度直方图(共有L个灰度级,每个出现概率为p):

(2)计算背景和目标的出现概率,计算方法如下:

上式中假设t为所选定的阈值,A代表背景(灰度级为0-N),根据直方图中的元素可知,Pa为背景出现的概率,同理B为目标,Pb为目标出现的概率。

(3)计算A和B两个区域的类间方差如下:

第一个表达式分别计算A和B区域的平均灰度值

第二个表达式计算灰度图像全局的灰度平均值;

第三个表达式计算A、B两个区域的类间方差。

(4)以上几个步骤计算出了单个灰度值上的类间方差,因此最佳分割门限值应该是图像中能够使得A与B的类间灰度方差最大的灰度值。在程序中需要对每个出现的灰度值据此进行寻优,并把该值作为阈值传进阈值分割函数中。

阈值分割后将得到一幅有异常区域(白点)的二值图像,然后对它进行腐蚀和膨胀运算,如图4所示。腐蚀和膨胀算法类似,本例是用一个3*3的结构元素(见图5)扫描图像中的每一个像素,用该结构元素中的每一个像素与其覆盖的像素做“与”操作:腐蚀时如果都为1,则该像素为1,否则为0;膨胀时如果都为0,则该像素为0,否则为1。经过腐蚀和膨胀计算后,可以有效去除噪声点和差分过程中的误差点,以保监控的有效性和可靠性。

5)计算膨胀后的二值图像非零点,即白点的像素数量。判断其与设定的值的关系,小于等于则认为是正常状态,否则认为监控区域有动态物体,报警并将异常的前景帧显示在对应的控件上。

以上是动态检测的原理和设计思路,具体的软件流程如下图6所示。

2软件设计与实验

VS2010下建立对话框程序,将OpenCV2.4.3的头和库文件等引到程序中。简单介绍下程序的界面:摄像机视频流在监控视频中显示,异常前景帧显示在报警图像里;灵敏度为动态检测步骤5中提到的自定义异常情况非零像素点的数目,检测间隔时间即为前景与背景抓帧的时间间隔;点击开始监控按钮时,将灵敏度和时间间隔参数传进程序中并开始从摄像机进行监控,而打开视频是打开指定的avi文件来进行监控,二者原理相同,见下图7。

3结论

实验结果表明仅有在身着白色并以跑的方式经过监控区域时有一次没有报警,其余情况均发现了监控区域的物体移动。漏报可能是速度过快或者与身着衣服和监控背景颜色类似有关。由此可见,该监控程序可以有效地对监控区域进行动态检测。

综上所述,基于OpenCV的机器视觉可对场景进行更为有效地动态检测,比红外探测器更有优势。相对红外探测配监控摄像机的组合,基于OpenCV的动态检测技术将传统的实时监测和视频记录完美结合,功能上实现“1+1>2”的效果。不仅克服红外探测器自身的诸多问题,更重要的是它可以延用原有的监控设备,并且可以根据需要采用针孔和防暴等特殊摄像机以更好地实现安防监控的目的。

参考文献

[1]陈胜勇,刘盛.基于OpenCV的计算机视觉技术实现.科学出版社,2009,8.

[2]夏良正.数字图像处理.东南大学出版社,1999,8.

计算机视觉检测技术范文篇4

【关键词】人脸检测技术;运动目标检测算法;帧间图像差分法

1、引言

基于图像的目标检测及报警技术,即在监控范围内设定警戒区域,对进入摄像机视线内的各个目标进行检查和跟踪,当有目标越过警戒区域时,进行报警联动和人脸检测输出。通过本设计的研究,实现人脸检测技术、运动目标检测技术与入侵报警技术结合的软件,为重点地区的视频监控技术的深度应用提供基础。

2、检测方法的确定

运动目标的检测跟踪是视频监控技术和计算机视觉的研究热点,其在解决智能视频监控,人机交互,智能交通系统等领域有着广泛而重要的应用[1]。人脸检测也是一种比较成熟的技术,然而人脸模式是很复杂的,而且易受外界干扰,常见的人脸检测算法一般都具有计算量大、速度慢、误报率高的弱点[2],因此我们要制定出最适合的解决方案。

2.1目标检测方法

运动目标主要分动态背景和静态背景,目标检测常用的方法是帧间图像差分法,背景图像差分法,光流法等。通过分析比较三种常用算法的优缺点:帧间差分法在动态背景下往往具有较好的识别率,但却不能提取运动物体的全部区域,从而使检测效果达不到理想情况[3];背景图像差分法可以较理想地提取运动物体的全部区域,但是较易受到监控现场光线变化等环境因素的影响,受到光线和天气因素影响时,需要动态确定阈值也难以满足实时处理的要求;光流法算法复杂、易受噪声影响,不利于实时处理[4]。综合考虑,帧间图像差分法计算量较小,易于实时处理,故选取帧间差分法进行目标检测。

2.2人脸检测方法

常用的人脸识别方法有基于几何特征的人脸识别方法、基于特征脸(PCA)的人脸识别方法和基于神经网络的人脸识别方法等方法。利用人脸的几何特征和面部颜色特征,找到适合实时视频处理的人脸追踪及精确标定方法。经过对这些方法的对比和研究,本课题选择了基于肤色的人脸检测算法即构建YCbCr色彩空间的肤色模型来完成人脸检测。人脸检测是在模式识别与计算机视觉领域最有挑战性的研究课题之一。由于人脸具有稳定的肤色和五官色彩特征,与其他物体颜色相比,有较强的独特性[5],因此,基于肤色进行人脸检测有其自身的优势。本文利用人脸肤色特征,对比人脸肤色在不同彩色空间下的聚类特性,采用YCbCr空间对彩色图像进行二值化分割,滤波,数学形态学处理等一系列预处理,精确检测并定位出彩色图像中的人脸区域。如图1所示。

3、实验方法、结果及分析

以上研究内容都要结合Matlab的仿真实验功能进行研究实现。其中包含基于肤色的人脸检测系统和运动目标检测的Matlab程序编程。作为完整的模式识别技术,人脸检测和运动目标识别都要进行特征提取、图像处理和增强、以及最终的识别分析,并联合报警电路,进而完成防区报警功能。具体来说,首先,由前端摄像机进行图像捕捉或者照相机进行图像记录,然后进行关键的图像处理,提取人脸特征或者运动目标是否侵入防区检测,最后进行判断是否有非法人员或者入侵行为进行报警。

通过matlab软件调取电脑摄像头读取实时视频图像,首先获得视频中的连续帧图像并保存,将连续的前后帧图像作差,并动态选取阈值将差值图二值化,得到目标运动的区域,将获得的目标区域进行面积比例计算,标定出运动物体的大致轮廓,并找到其中心位置,根据运动方向实时绘制其运动轨迹如图2、3所示。

对于进入监控区域的人,对其面部进行跟踪,达到合适的阈值时截取视频图像,对视频图像进行人脸区域识别,并准确标定面部各区域位置。这个过程大致描述如下:

首先将获得的包含人脸区域的图像转换到Ycbcr空间,并结合cb,cr通道提取肤色区域,然后进行形态学滤波,通过选定区域的高度宽度比例确定人脸区域,并进行标定。

最后,将运动目标检测和人脸区域跟踪及识别进行结合,在视频监控区域设定报警区域,当目标进入监控区域内后自动跟踪目标,绘制目标运动轨迹,当目标进入报警区域后自动检测目标的人脸区域,当目标人脸区域达到规定阈值,自动识别和标定人脸区域,并弹出照片,相应的发出报警。

【参考文献】

[1]汪惠兰.基于Matlab实时运动目标跟踪检测系统[J].计算机安全,2012(3).

[2]高彦斌,徐建良.基于肤色特征的人脸检测[J].中国新技术新产品,2012(6).

[3]LiptonA,FujiyoshiH,PatilR.Movingtargetclassificationandtrackingfromreal-timevideo[J].IEEEWorkshopofApplicationsofComputerVision,Princeton,NJ,1998,8-14.

计算机视觉检测技术范文篇5

【关键词】运动目标检测视频图像OpenCV

一、绪论

随着计算机技术日新月异的发展,计算机视觉,模式识别,人工智能,多媒体技术,越来越受到人们的重视的快速发展。广泛地被定位对象使用运动跟踪和检测,监测和智能人机交互和分析他们的行为,一旦发现有异常行为的对象,监控系统发出警报,提醒人们注意和及时的治疗,改善人类的人工监督注意力浪费资源等问题。计算机视觉是通过计算机代替人的眼睛和大脑感知外部环境,分析和理解。

1.1OpenCV技术介绍

视觉处理算法的OpenCV提供了非常丰富的,它部分是用C写的,有它的开源特性,妥善处理,无需添加新的外部支持进行编译和链接,生成程序的完整实现,所以很多人们用它做算术移植,OpenCV的可正常运行的系统DSP和MCU系统正常重写代码。

二、运动目标检测

运动目标的检测在整个视频监控系统的底层,各种高级应用,如目标跟踪,目标分类,目标行为的随访,了解互惠的基础。运动对象检测装置,从在实时目标视频流中提取,目标通常设置面积和颜色特性。结果运动目标检测是描述一些静态功能的“静态”的目标前景。根据上下文,其中环境可分为两大类静态背景下运动目标检测和动态背景运动目标检测,本章与实际纸工作主摄像机静态背景运动目标运动结合,不会发生前景对象的运动目标检测检测算法。

2.1运动目标检测的基本方法

目标检测和提取已在目标跟踪应用程序中的重要地位。目标检测和提取的精度直接影响结果和准确性的跟踪。一个良好的各种环境动目标检测算法的应能适用于监测,在正常情况下,移动体检测算法可以根据场景被监视在室内或室外监测算法被分成室内和室外监视算法,则可以按照使用特定算法的方法分为连续帧差分方法,背景减除法和光流法。

2.1.1帧间差分法

对于许多应用,图像的连续帧之间的差检测出图像的顺序是非常重要的一步。场景中的任何可观察到的运动将反映在场景图像序列的变化,如果能检测到这种变化,我们可以分析的运动特性。

2.1.2背景差法

基于该原理的背景差分方法非常简单,基本操作过程示于(4.2)如下:首先使用式(4.3)来计算背景图像之间的差fbk当前帧fk,然后根据下式(4.4)是差分图像的Dk值化和形态学滤波处理,并获得当该区域的通信区域比给定的阈值RK进行连通区域分析的结果,它成为检测对象,并且该区域是区域目标在区间的,你能确定的最小边界矩形的目标。

其中T是二值化设定阀值。

2.1.3光流法

光流是指在图像模式(或表观的)运动的表观亮度。用“表观运动”,主要是由于光流的运动图像不能有部分信息只以确定,例如,区域性或亮度轮廓点更均匀的亮度不能唯一确定的运动对应的点,但观察到的运动。这解释了光流和该流不一定是由物体的运动所产生的光,而运动的主体不一定会产生光流体育场不一定是唯一的。

三、目标跟踪算法的研究

目标对象的运动信息的条件的先验知识下跟踪,通过从信息源的实时数据来估计所述目标状态,以实现所述目标位置和运动趋势判定。运动目标跟踪问题是一个复杂的估计。研究精度高,性能稳定,目标跟踪方法的适用性仍面临巨大挑战,具有重要的理论意义和实用价值。

3.1图像匹配法

通过图像匹配方法可以识别要跟踪的运动对象,并确定它们的相对位置。早期跟踪涉及的目标位置的变化的两个图像之间的测量计算出的相关函数,跟踪点是,这两个图象相匹配的最佳位置,这是相关函数的峰值。

3.2基于团块的目标跟踪

基于团块(BLOB)的基本原理是用于图像分割候选像素跟踪算法,它决定像素是否属于背景或属于定位或属于其他区域。基于跟踪算法的质量也可称为基于图像分割的跟踪,分割结果刚够目标和背景之间的区分,而传统的图像分割算法需要目标轮廓的精确显示。分裂台球在目标,纹理特征和图像的深度信息的一般特性。

四、结语

随着在军事领域的计算机视觉,智能交通监控,视频运动目标检测与跟踪的发展必将得到更广泛的应用和发展。在本文中,历时四个月中,主要研究的OpenCV实现运动目标检测与跟踪的应用,实验结果表明,该系统具有良好的鲁棒性和准确性,实现毕业设计的预期目标,在工作和问题结合起来实际应用中。

参考文献

[1]刘瑞祯,于仕琪.OpenCV教程基础篇[M].北京:北京航空航天大学出版社,2007.

[2]彭达.VisualC++多媒体编程技术[M].北京:人民邮电出版社,1999.

[3]丁金铸.基于图像处理的运动目标检测跟踪系统的设计与实现[D].华中师范大学,2007.

[4]王建中,姜昱明.基于块匹配的运动对象检测算法[J].微电子与计算机,2005,22(1):10-12.

[5]林少丹.VC++程序设计基础[M].北京:人民交通出版社,2009.

[6]唐双发.基于OpenCV的车辆视频检测技术研究[D].华中科技大学,2009.

[7]李庆忠,陈显华,王立红.视频监视中运动目标检测与识别方法[J].计算机工程,2004,30(16):30-33.

[8]胡晓峰,吴玲达,老松杨,司光亚.多媒体技术教程[M].北京:人民邮电出版社,2002.

[9]韩鸿哲,王志良,刘冀伟,李郴,韩忠涛.阴影消除的自适应背景建模[C].第二届全国智能视觉监控学术会议论文集,2003,35-39.[10]张玲,叶海炳,何伟.一种基于边缘信息的改进车辆检测方法[J].重庆大学学报(自然科学版),2004,27(11):56-58.

[11]J.B.Kim,H.J.Kim.EfficientRegion―basedMotionSegmentationforVideoMonitoringSystem[J].PatternRecognitionLetters,2003,3(24):113-128.

[12]王春平,朱元昌,黄允华.基于图像信息的跟踪算法分析[J].火力与指挥控制,2000,25(1):64-67.

[13]杨枝灵,王开.VisualC++数字图像获取处理及实践应用[M].北京:人民邮电出版社,2003.

计算机视觉检测技术范文篇6

基于力学特性的检测方法

力学方法是利用食品与农产品的力学特性而进行检测的方法.利用声波和振动可以测出食品的品质指标以及检测待测物内部的组织状态。如利用声波透射法测定牛乳中脂肪的含量及大豆的水分:用超声波在物体中密度有差异处的反射波测定法,检查家禽的肉质,脂肪层厚度,里脊肉断面等。国外研究者研讨了多种基于动力学原理的农产品硬度检测方法,如机械冲击产生的声频信号检测,机械冲击相应的频率分析和水果冲击力检测。

基于电磁学特性的检测方法

电磁法分为主动特性法和被动特性法两种。主动特性法是利用待测物自身所具有的某种电磁学的测量方法;而被动特性法是将待测物置于电磁场内,利用其受电磁影响后反过来对外部环境施加影响的特性测量方法,例如核磁共振和电子自旋共振等。电磁@-TY法所需的设备相对比较简单,数据的获取和处理也比较容易,因此应用前景比较广阔。

基于光学特性的检测方法

紫外光谱法,可见光谱法,近红外光谱法是食品内部品质无损检测有效的方法。它是通过食品对光的吸收,散射,反射,透射等特性来确定食品内部品质的一种方法。该项技术可广泛用于谷物,果树等多种产品的化学成分分析,物理学品质分析,色度学品质分析。

基于放射线特性的检测方法

x射线,B射线和可见光都具有透射,反射和漫射等性质.x射线技术主要是利用穿透能力较弱的x射线作为光源进行透视探查的技术.因食品密度与金属等物质相比要小得多,因此所需x射线强度较小,通常称其为软x射线,其主要用于测定物体的密度差,判别内部缺陷和异物检出.如X射线图像用于检测鸡肉内部较深部位的骨头,但对表面骨头检测比较困难,而可见光图像则正相反.另外,软x射线还可以用来检测如柑橘中的皱皮等缺损现象,检测水果损伤缺陷,如苹果的水芯及损伤等。

机器视觉检测技术

机器视觉技术是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。机器视觉的最终目标就是使计算机能像人一样通过视觉观察并理解世界,具有自主适应环境等能力。在实现最终目标前,人们努力的中期目标是建立一种视觉系统,这个系统能够通过视觉敏感和反馈的某种程度从而智能的完成一项任务。随着图像处理技术的发展和计算机软硬件的开发,食品品质自动检测和分级领域应用机器视觉系统也变得越来越具有吸引力。应以斌等人以表面色泽与固酸比为柑橘成熟度指标,建立了用于柑橘成熟度检测的机器视觉系统,并建立了利用协方差矩阵和样本属于桔黄色和绿色的概率来判断柑橘成熟度的判别分析法,并以实测的固酸比值作为对照,对72枚柑橘样本进行了试验,柑橘成熟度的判别准确率达到91.67%。

生物传感器技术

21世纪是生命科学的世纪,而生物传感器横跨生物,化学,物理,信息等领域,结合了生物技术,材料技术,纳米技术,微电子技术等,是一门交叉学科的研究与应用技术,也是当今世界科学发展的前沿,引起各国的极大关注。生物传感器是由产生信号的敏感元件和处理信号的辅助仪器两部分组成的,敏感元件由生物活性单元(如酶,抗体,微生物,DNA等)和换能器组成,换能器可用来捕捉生物活性单元与目标物反应过程中的信号。生物活性单元引起的变化不同,信号处理的方法也不同。根据检测信号的不同.可将生物传感器分为电化学传感器,阻抗生物传感器,压电生物传感器和光生物传感器。与各种传统的化学传感器,物理传感器相比,具有选择性好,xA-析速度快,灵敏度高,不需进行样品预处理,可进行连续在线检测,成本低等特点。生物传感器在食品检测中的应用非常广泛,几乎渗透到各个方面,包括食品基本成分的检测,食品中添加剂的检测,有毒有害成分的检测等等。

展望

计算机视觉检测技术范文1篇7

关键词:ABB;视觉识别

中图分类号:TP242.2文献标识码:A文章编号:1674-7712(2014)12-0000-01

目前,全自动机器人解包系统在烟草行业内应用广泛,以其设备先进性、系统稳定性、操作简便性、超高的行业适应性以及灵活的可扩展性和兼容性得到了各烟草工业企业的认可。为了适应烟草行业全自动控制、现代化的生产要求,我厂制丝解包线选用了FT533全自动机器人解包系统,集合了当前最先进的自控、机器人、信息管理和机器人视觉技术,是一条全自动、高效率的机器人解包上料物流系统[1]。该系统设备先进、自动化程度高,是我厂制丝线生产的首道工序,也是我厂自动化生产的亮点工序。

该系统中所运用的机器人视觉检测技术,是当今最新的检测技术。计算机视觉检测就是由各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。我厂采用的CCD检测技术光谱响应宽、动态范围大、灵敏度和几何精度高、噪声低,在检测系统的智能化、柔性、快速性等方面较接触式检测方法具有更大的优越性。因此,计算机视觉检测技术在我厂解包线的适应性应用是决定解包线能否高精度、高效率工作的关键。

一、现状分析

在实际生产过程中,我们发现解包线机器视觉检测还存在以下几个问题:

(一)外部光照不稳定

我厂解包线机器人安装位置紧靠一整面玻璃墙,CCD相机照相取样极易被外部自然光照所干扰,尤其在阳光最强烈的正午和阴暗天气时干扰最为明显,相机照相或曝光过度,或阴暗不明,成像质量较差,严重干扰了计算机对图像的分析和处理,导致机器人不能准确动作。

(二)视觉处理系统对烟包图像分析不准确

目前采用的图像分析方法不能够精确分析图像,对一些潜在问题未能做出相应判断和处理,导致机器人在实际生产过程中出现误动作,影响解包线效率。失误率平均达到5包/批次(20包)。

二、具体思路与方法

(一)成像系统曝光度适应性差的问题

一天中随着太阳的移动,车间中的光照强度也随之变化。根据这一实际情况,项目小组将针对各时段不同光照下,解带工段成像系统PV带识别程度,寻求成像系统曝光增益的最优值。根据剪带机器人工段对成像系统图像的要求,课题小组采用分段逐一测试的方法,对各时间段曝光增益值进行了实验测试,找到最佳的参数值。

(二)规划时间段

根据从气象网站统计,绵阳9月-12月的日出时间在6:00-7:00之间,日落时间在18:00-19:00之间,同时日出日落后半个小时光照强度变化幅度较大以及11:00-14:00光照强度最强,将一天划分出8个时间段。

(三)确定曝光增益

曝光增益是曝光的一种补偿方式。如果图像明显偏亮或偏暗,说明相机的曝光基准值设定较大偏差,这时要强制进行曝光补偿。在解包线成像系统中,最终经过补偿后的图像一定要到达这样的要求:图像轮廓清晰,处理算法能识别到所有编织带。课题小组将根据划分出的时间段逐一对曝光增益值进行设定。

(四)烟包检测识别能力较差

鉴于二值化处理的目标图像失真较大,在新的算法过程中课题小组决定放弃在边缘检测前使用二值化处理,通过使用烟包四边边缘检测和中缝检测相结合的方法来计算烟包中心点。影响开包工段烟包识别的准确度的关键点是找准图像中烟包的中心点,如果图像中心点与实际烟包中心点偏差过大,就会导致机械手爪臂将烟包损坏,影响后续开包动作的完成效果。原处理方式采用二值化处理。但二值化自适应性较差,在处理过程中极易将目标边缘周围像素点与目标本身混淆,导致二值化后目标轮廓失真,影响后续边缘检测准确性。

根据观察分析,每个烟包都有一个共同的特性:烟包的最上的两个合页闭合时,在烟包中间都会形成一条中缝,而且这个中缝的像素点灰度值与周边的像素点灰度值差异明显,噪声小,容易清楚识别。因此,考虑将中缝检测加入到烟包的中心点的计算中,提高中心点的准确性[2]。

(五)建立成像系统与PLC数据通讯通道

首先在PLC编写程序获取系统时间,并将时分秒分割出用于传递到成像系统。其次,成像系统中创建数据缓冲区,用于读取PLC传递的时间数据。为方便数据比较将时间格式处理为小数格式,如11时15分转换为11.15,这样方便进行大小对比,公式为时+分/100。

三、结束语

通过确定时间段曝光增益值、烟包四边边缘检测和中缝检测相结合的方法来计算烟包中心点等方法的使用。增强了机器视觉检测的环境适应性和抗干扰能力,降低片烟预处理工段断料次数、减少人力劳动。改善后识别效果如图1所示。分时段曝光增益方法以及中线和边缘检测相结合的图像分析方法不仅适用于我厂解包线机器人视觉系统,同样适用于其他工业领域的机器视觉图像检测分析系统。特别是为外部光照条件不稳定的机器视觉处理提供了一种新的思路和方法,增强了机器视觉检测的环境适应性和抗干扰能力。

图1PV带完全识别示意图

参考文献:

[1]ABB机器人全套手册Nov2008[M],2008.

计算机视觉检测技术范文篇8

关键词:视觉检测技术;f150视觉传感器;玻锥生产线

1引言

机器视觉技术作为计算机科学的一个重要分支,在近三十年中有迅速的发展。由于机器视觉系统可以快速获取大量信息并自动进行数据处理,易于设计信息及加工控制信息集成。因此在现代自动化生产过程中,机器视觉系统被广泛用于工业监视、成品检验、质量控制和数据测量等领域。工业视觉系统是实现现场工业自动化的基础技术,尤其是要求高速化或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉。玻锥生产线的自动化程度很高,目前用视觉识别系统取代人工进行检测不仅可以减轻工人劳动强度,而且能减少次品和提高生产效率。但是机器视觉系统也有它的局限性,因此对于不同的检测对象或不同的工艺要求要具体分析,采取不同的检测方案。故在此介绍在安飞公司的玻壳生产线中采用机器视觉取代人工视觉进行检测的应用方法。

2欧姆龙f150视觉系统简介

(1)基本原理:机器视觉检测系统通常采用ccd(chargecoupledevice)。摄像机摄取检测图像并将其转化为数字信号,再采用先进的计算机硬件与软件技术对图像数字信号处理,得到所需的目标图像特定值,并在此基础上实现模式识别、坐标计算、灰度分布图等功能。机器视觉检测系统能够根据检测结果快速的显示图像、输出数据、指令。执行机构可配合其完成位置调整、好坏筛选、数据统计等自动化流程。与人工视觉相比,机器视觉最大的优点是精确、快速、可靠、稳定以及信息数字化。机器视觉系统主要由图像的获取、图像的处理和输出显示组成。

图像获取设备包括光源、摄像机等,其中关键的部件为摄像机中的ccd由分布于其上的各个像元光敏二极管的线性阵列或矩形阵列构成,通过顺序输出每个二极管的电压脉冲,实现将图像光信号转换成电信号的目的。输出的电压脉冲序列可以直接以rs-170制式输入标准显示器,或者输入计算机的内存进行数值化处理。ccd是目前最常用的机器视觉传感器,图像处理设备包括相应的软件和硬件系统。输出设备与过程相连,包括监视界面、过程控制器和报警装置等。摄像数据通过计算机对标准和故障图形的分析和比较,若发现不良产品,则发出ng信号报警,并通知plc进行下一步处理。机器视觉检测的结果可以作为计算机辅助质量caq(computeraidedquality)系统的信息来源,也可以和其他控制系统集成。

(2)主要性能指标:安飞公司玻锥生产线视觉检测系统采用欧姆龙公司的f150视觉传感器。系统像素为512×480,可以记录二十三个个不同物件的标准画面,存储二十三个画面不合格物件图像,即可确定二十三种不合格的情况,以便于在生产中进行比较和回馈。图像处理采用二值化方法。数据及图像的存储通过rs232接口与plc相连。摄影机和光源装置为f150-c1×e-c型。其中摄影机部分为1/3寸ccd摄像元件,电子快门有1/100、1/500、1/2000、1/10000s等多种选择。检测范围为50mm×50mm。

(3)系统基本构成:系统中起核心作用的是控制器,基于二值化和灰度理论,可处理ccd镜头以像素为单位由光信号转换而来的电信号,并提供测量模式、输入输出和通信手段。控制器通过专用信号线与摄像机相连。使用者可手持编程器在显示器上选择测量模式,检查区域及设定检查条件。最后在控制器中产生特定信号,由可编程控制器接收,控制执行元件完成特定的动作如取像、检测、执行等。

视觉检测系统的基本结构如图1。

3系统应用

(1)硬件连接(如图2)。

(2)通讯参数设置:通讯方式:rs232,传输速率:9600bps,传输字长:8位,停止位:1位,奇偶校验:无。

(3)判断条件设置:为使摄像机得到更准确的测量值,需先将待测物体放在照相机与光源中间,并在照相机的视野范围内调整光源强度,之后由检测物自身的形状、颜色及透光度来设定快门速度(shutterspeed)、滤波(filitering)和背景抑制级别(bgslevels),设定好后必须能够看清楚被检测物的轮廓,并且轮廓边缘不能闪烁,否则摄像机将不能检测到理想效果。在安飞公司中摄像机快门速度设为1/2000s,滤波设为强过滤,背景抑制级别上限取255下限取156。

(4)检查项目和领域设定:接着设定搜索领域(region),进行方向、颜色、边缘层和位置的设定,之后进入位置补偿(positioncompensation)调节补偿区域及方向,最后进入数据(date)中设置表达式,在此表达式设为r1.eg-r0.eg。以上设置结束后存储设定内容,将模式更换为运行(run)模式进行检测。使用者可以手持式编程器的触发按键{trigger})进行单次的测量,也可以通过可编程控制器发出“开始检测(measure/c)”命令来进行触发测量,用“结束检测(measure/e)”来结束测量。在安飞公司的玻锥生产中就采用了后一种方法,数据将根据需要进行显示并传输到可编程控制器。

(5)摄像机检测主菜单如下:

(6)系统功能。

本系统主要实现的功能如下:摄像机共进行两次照相首次照相首先检测切割完小头的玻锥,检测切割是否成功。当检测值不在预设的正常值范围内时显示器显示ng符号,同时plc发出报警信号将产品排除生产线。当检测正常时,程序正常进行,摄像机检测的数据自动显示在显示屏上,之后plc使管径下移,照相机二次照相照出锥体与管径的间距,将数据传送至plc,由plc进行下一步处理并在显示屏上刷新数据。在实际应用中,我们注意到光源的亮度对生产的影响很大,当亮度过高时由于反光会造成检测误差,而过低时则不会正常显像。

4结语

omron公司的f150视觉传感器自在安飞公司玻锥生产线应用以来,系统运行稳定、可靠。其测量精度可以达到±0.001mm,完全达到生产工艺要求。该方法方便、快捷、有效地实现玻锥与管径间的测量。本系统采用的是欧姆龙公司中端的f150系统,而其最新推出的f160系统,则可以满足更高端的指标要求,但同时成本会也有一定的提高。使用者可结合不同检测系统的成本及工业现场实际要求,比较灵活的采用不同的系统。

计算机视觉检测技术范文篇9

[关键词]行人检测;夜间行车安全;社会价值

[DOI]10.13939/ki.zgsc.2016.15.045

随着人们生活水平的不断提高,汽车已成为我国代步工具中的一大种类。据国家公安部通报,2013年,全国汽车增加1651万辆、驾驶人增加1790万人。方便之余,随之而来的交通安全问题,却成为威胁人们生命的不可忽视的关键。据交通部透露,交通事故在夜间行车中发生的概率较高。有数据显示,虽然40%左右的交通事故在夜间发生,但却有高达60%的事故死亡率。由此可见,夜间行车的危险指数远远高于白天行车。因此,夜间行车安全应该得到更多的重视。

1夜间行人检测研究的社会价值

产生夜间行车安全问题的因素[1]主要有两个:其一,也是夜间交通事故发生的主要原因,是由于夜间光线较暗,驾驶员视角窄,视线模糊,不能准确地对路况进行预判,对潜在危险的处理滞后;其二,根据人体生物钟规律变化,夜间驾驶员身体的各方面机能都有明显下降,加之行车过程视觉效果不好,可依赖的条件少,为了准确、快速地对速度和距离进行判断,行车过程中驾驶员必须注意力高度集中,更容易产生紧张情绪,易疲劳。而中国城市人口密集度高,行人、自行车、电动车交错穿行,机动车驾驶员稍有不慎,就容易产生碰撞冲突,造成事故伤亡。针对中国交通现状的需求,充分利用汽车安全辅助驾驶技术对路面行人情况进行全面、正确的判断和分析,缓解汽车驾驶员视觉范围有限、精力有限的缺点,是提高我国安全行车系数的重要保障。近年来,国内外很多学者高度关注智能视觉监控领域,在理论知识和实际应用两个方面都取得了一定的进展。行人检测也因为在此领域有着广泛的应用而备受广大学者与研究人员的热衷。然而,目前的行人检测技术尚未达到人们预期的效果。运动过程中的行人检测是一项相当复杂的工程,涉及计算机视觉和模式识别,车辆定位技术,人体形态学等诸多学科,有许多技术难点有待研究人员攻克。进行行人检测研究不论在理论研究方面或者实际应用方面均具有较高的应用价值和经济潜力。

2研究现状

行人检测与识别研究开始于20世纪90年代中期,经过大量研究,目前已形成许多可行性方案,为后期的研究人员提供了一系列具有较高参考价值的理论体系和应用系统。

2.1国外研究现状

目前,国外学者在行人检测图像采集途径上可分为基于可见光图像和基于红外图像两种方法。可见,光图像作为人们日常生活中的常用图像采集手段,受光照程度的影响对图像中目标的识别存在很大的差别,光线不足的条件下,能见距离和能见度会明显下降,影响正常视频图像采集。而红外成像又称红外辐射,利用电磁波强大的“穿透”能力,可以通过黑暗、烟雾等外界因素,形成可见光下看不到的目标表面的温度分布图,但因为其图像层次感差、轮廓模糊等缺陷,在日常生活中使用较少。在行人检测方法上现有两大类[2]:第一类是基于视觉传感器的行人检测方法,常用的方法有:基于小波和支持向量机的方法、基于运动特征的方法、基于立体视觉的方法、基于形状信息的方法、基于行人模型的方法等。早期的视觉传感器系统多借鉴基于静态摄像头的静态视觉监控技术,包括图像处理中的图像分割、边缘提取、图像匹配、光流、运动检测等技术及模式识别中的一些简单分类算法。随着智能化水平的不断提高,传感器也在不断更新中。目前较为前沿的行人检测方法是基于立体视觉的方法,即利用多部摄像机作为视觉传感器,在多方位同时进行图像采集,得到场景中行人的空间信息,但算法复杂、计算量大。多数使用的方法是利用多种传感器信息融合的技术。第二类是基于非视觉传感器的行人检测方法[3],常用的方法有:基于激光测距传感器的方法、基于微波雷达的方法、基于红外线成像传感器的方法等。两类方法均使用广泛,且结合适当的图像预处理技术和相关算法后均能用于夜间行人检测,为夜间行人检测的进行奠定了充足的基础。现有的行人检测技术的两个主要侧重点分别为运动和形状。侧重于运动的检测方法是通过分析运动过程中人体行走的周期频率来进行行人检测。行走时,人体呈现出一定周期性的步态,处理过程中将先待检测图像序列的周期性与预先分析得到的行人步态的周期性进行对比,就可以判断出是不是行人。该方法的优点在于降低了光线变化和人体纹理产生的影响,但需要经过多帧对比才能得出判断结果,判断速度不及时,且只能检测运动过程中的行人。该方法的典型代表有基于光流法的行人检测。而侧重于形状的检测方法是通过对边缘、灰度、轮廓等信息的分析检测,达到对目标进行检测的目的。该方法既能检测运动的行人,亦能检测静止状态的行人,但易将不是行人的目标错认为行人而产生虚警信息。其典型方法有基于统计分类的方法、基于局部模型的方法和基于模板匹配的方法。但实际工程设计时,多采用两种方法同时使用,比如:Viola等人利用AdaBoost算法对人体的类Haar特征进行训练行人检测器[4],并融合进行人的外貌特征和肢体运动信息进行检测,取得了良好效果,在有行人、非机动车和运行汽车的环境下,能较好地检测出步行的行人。此外,利用一些交叉学科的系统对人体进行建模,通过模型对运动物体进行识别检测也是目前较可行的方法。国际上现有的可以使用的行人检测系统[5]主要有:①2004年11月,在第38届东京车展上,三菱汽车公司(戴姆勒•克莱斯勒旗下)推出的以行人检测技术为支撑的三菱扶桑概念车,该车能在不超过150km/h车速的情况下,在多种天气条件下,对行人作出快速准确的检测,为驾驶者提供危险状况报警,并提供一定的安全应急措施;②2006年3月,在第76届日内瓦车展上,雷克萨斯LS460概念车集成了立体视觉近红线外加激光雷达的行人检测系统,能够以30~40km/h的车速,在距离车辆30~50m处检测出在人行横道上行走的行人;③2007年4月,在英国伦敦科学博物馆展出的无人驾驶汽车(德国大众汽车公司研制),能在不超过183米的范围内识别各种交通标识,并利用激光摄像机对汽车周围的行人和道路状况等障碍进行检测。

2.2国内研究现状

我国在行人检测技术方面,主要研究静止摄像机以及图像采集条件较好的行人检测,与此同时也在积极摸索运动摄像机情况下及夜间等受自然条件制约场景的行人检测。国内进行行人检测与跟踪研究的单位现有:浙江大学、中山大学、清华大学、哈尔滨工业大学、厦门大学、重庆大学、四川大学、长安大学、安徽大学、武汉理工大学等。浙江理工大学的徐振兴针对传统形状上下文特征在行人检测中区域划分较密的问题改进区域划分的方法,并在研究中引入随机森林分类器和点对比较特征进行行人检测。[6]苏州大学的王宝兴在单视点固定摄像头场景下提出了一种基于局部时空域模型的核密度估计行人检测算法,在单视点移动摄像头场景下提出了一种融合目标多特征的行人检测算法,并提出了基于卡尔曼滤波和显著区域检测的行人识别算法[7]用于处理由于高空视频细节模糊、背景杂乱等特点所导致的行人分割与识别困难问题。南京理工大学的陶建峰针对单特征辨识度较低和人体尺度多样性问题,提出一种多特征融合的行人检测方法。[8]

3主要存在的问题

近年来,国内外学者在夜间行人检测与运动跟踪领域的研究方面取得了一定的进展,但由于学科技术发展水平有限、实验设备性能不足、视频图像环境复杂等各方面因素的限制,至今仍然不能研究出一种方法能够在各种场景条件下都通用,其中,存在的主要技术问题有以下几点:(1)动态视频图像采集的背景多样性问题。目前,行人检测研究多以静态背景进行,原因在于动态场景下检测目标及背景环境均在不断变化中,将出现多个不同类型复杂目标的遮挡问题。车身摄像机随车辆的抖动、偏转会发生拍摄角度及清晰度的变化,影响行人识别与检测的准确率。且对行人检测系统的鲁棒性(即应对“突然打击下”的适应能力)提出了更高的要求。(2)夜间图像采集的复杂性问题。首先,夜间光线较弱,图像灰度值较高,色彩辨析困难,导致干扰因素多,阴影面积大;其次,现有的夜间图像采集多数使用红外线设备,红外图像分辨率低,层次感差,纹理信息少,轮廓模糊,导致夜间行人目标的检测难度更大。因此,目前进行夜间行人检测的研究项目的比重相对较低。(3)行人外观和姿态的多样性问题。人体柔韧性强,具有多种形态,结合身材和衣着的差异,往往在行人识别检测中相差甚远。现有的行人特征有多种,但要获得较好的检测结果,既受到图像本身属性的直接影响,又取决于使用算法的选择,所以,通常不直接将特定的特征和通用的算法应用于行人识别检测。(4)行人检测目标的快速准确判断。车载嵌入式系统随着车辆的行驶,行车速度、行车环境都在不断变化,相应采集到的图像信息复杂性高,且计算机运算速度有限,因此,如何快速地对采集到的目标进行分割、识别与检测成为实时检测系统的一大难题。

参考文献:

[1]田翠翠.基于红外图像的夜间行人检测技术研究[D].重庆:重庆大学,2010.

[2]许腾,黄铁军,田永鸿.车载视觉系统中的行人检测技术综述[J].中国图像图形学报,2013,18(4):359-367.

[3]庄家俊,刘琼.面向辅助驾驶的夜间行人检测方法[J].华南理工大学学报,2012,40(8):56-62.

[4]陈志恒,姜明新.基于OpenCV的人脸检测系统的设计[J].电子设计工程,2012,20(10):182-185.

[5]单晓森.混合交通中行人检测方法研究[D].哈尔滨:哈尔滨工程大学,2011.

[6]徐振兴.基于机器视觉的行为检测和跟踪技术研究[D].杭州:浙江理工大学,2012.

[7]王兴宝.复杂场景下多姿态行人检测与识别方法研究[D].苏州:苏州大学,2012.

计算机视觉检测技术范文

(东北石油大学,黑龙江大庆163318)

摘要:以排球运动轨迹为研究对象,将计算机视觉、视频分析处理技术相结合,研究了基于视频的排球轨迹获取关键技术,通过视频帧处理、运动目标检测、识别跟踪、轨迹提取等一系列步骤从视频中精准提取排球运动轨迹信息,采用IntelOpenCV及Matlab设计并实现一套排球智能分析系统,为排球比赛分析及球队战术训练等提供决策支持.

关键词:视频;目标检测;识别跟踪;轨迹提取

中图分类号:G842文献标识码:A文章编号:1673-260X(2015)02-0182-02

随着计算机视觉技术和图像处理技术的飞速发展,基于视频的运动目标检测及跟踪技术在排球等体育项目中应用越来越广泛.针对排球比赛技术分析和指导的应用需求,本文以排球的检测跟踪及运动轨迹为研究对象,将计算机视觉技术、图像处理技术相结合,提出基于视频的排球检测、跟踪、轨迹获取整体解决方案,采用IntelOpenCV及matlab开发一套排球智能分析系统.系统采用双摄像机同步读取两个摄像头实时捕获的视频,获取不同方位的排球运动图像信息.通过标定两台摄像机的内外参数获得排球的三维坐标.从系统实时性和鲁棒性要求出发,使用背景差分法实现对排球的快速检测.同时结合排球的形状、颜色、亮度等特性实现对排球的识别与空间定位.利用排球的运动特性,建立并修正其运动轨迹方程.通过两个摄像头同步获得的轨迹曲线实现排球三维运动轨迹的曲线合成.该曲线不仅可以记录每一时刻球体的位置信息,而且包含球体的运动方向、运动速度、轮廓参数等信息.最后,分析球体轨迹曲线特征,并将轨迹模型包含的信息作为智能分析系统的输入,用于战略战术分析、队员动作分析等,为排球运动研究提供准确依据和决策支持,进而提高了比赛研究人员的工作效率.

1关键技术分析实现

基于视频的排球智能分析系统的设计与实现主要涉及视频帧处理、运动目标检测识别、运动轨迹提取等几方面技术.整个系统的工作流程如下:

(1)进行摄像机标定和场地标定,获得摄像机内外参数以及场地边界数据,同时将图像的像素坐标映射成实际场地坐标.

(2)接收由摄像机和图像采集卡等视频设备获取的数字信号,并将采集到的每帧数据保存为静态图像.

(3)比赛开始后启动系统,利用运动目标检测算法检测是否有运动目标.

(4)通过特定的运动目标跟踪识别算法从图像中分割并提取出运动目标.

(5)根据双目摄像机所获取的目标质心坐标得到排球的三维坐标值,记录其运动轨迹数据和轨迹特征,建立运动轨迹方程.

(6)将轨迹曲线特征作为智能分析系统的输入,用于比赛训练等的裁判决策和智能分析.

1.1视频信息的获取

本系统要根据采集到的视频信息获得排球的运动轨迹曲线图,因此要通过摄像机标定实现从视频设备中获得的二维图像到运动目标三维坐标信息的对应转换[1].系统首先采用线性标定或张正友标定等传统标定法对摄像机进行标定,获取摄像机的内外参数以及双目摄像机的位姿关系[2].完成摄像机和场地的标定后,接收由视频设备获取的数字信号,按一定的采样间隔进行采样,得到时变序列图像集,并将采集到的每帧数据保存为静态图像.系统通过双目摄相机可同时从不同角度获取两幅图像,然后基于视差原理恢复运动目标的三维几何信息[3].视频在生成以及传输过程中,会因外界环境的影响产生一些噪声,预处理阶段可采用图像滤波方法等对图像帧进行去噪处理,提高视频帧的质量,便于后期的分析处理.

1.2运动目标检测

由于摄像机和运动场地背景处于相对静止状态,而当前在静止背景下常用的运动目标检测方法有背景差分法、帧间差分法、光流法和运动能量法等[4].背景差分法是基于图像序列和参考背景模型相减实现运动目标检测的,是当前最常用的运动目标检测方法之一.它首先抓取图像作为背景图像,之后利用当前图像与背景图像差分从而检测出运动物体.该方法能够较完整地提取出运动目标,位置精确,实时性好,因此本系统设计中采用了背景差分法来提取排球运动模型,使用Intel公司提供的计算机视觉函数库OpenCV进行图像处理和计算机视觉方面的算法.首先采集图像,然后统计特征点,检测当前系统状态下是否有运动目标.若有,则采集视频数据,并保存成序列图像.若无运动目标则保存背景继续检测判断.得到背景图像和含有目标的一帧图像后,利用图像减运算可得到背景差分图像.之后进行噪音去除、连通区域标记、基于排球亮度形状颜色等的特征匹配,对连续图像中的排球目标进行检测,通过分析排球对象在比赛视频中的面积、形态等属性范围目标区域边缘提取等筛选出候选排球对象,最终将目标识别出来.

1.3运动目标跟踪识别

国内外相关研究人员已经在球体的检测与识别方面做了相应的研究.刘斐等人提出一种混合颜色空间查找表的颜色分类方法,用于对图像进行颜色分割,并建立颜色查找表,依据颜色信息实现在线快速分类,识别球体.也有依据形状进行边缘信息提取来识别球体的.常用的边缘提取方法有Prewitt算子、Sobel算子、Laplacian算子和Canny算子等,其中Canny算子能很好地提取出图像的单边缘信息,具有较快的速度.赛场上常用的“鹰眼”技术已经发展得比较成熟,主要用于体育赛事的即时回放,但回放时间的长度有限,且需要多个高速摄像机,价格比较昂贵.Lipton等使用空间差减法在真实的视频流中检测并跟踪运动目标.此外,有一种改进方法是使用三帧差分代替两帧差分.该算法计算非常快,在图像序列中检测运动对象非常有效.

1.4轨迹曲线提取

近年来,在众多学者的努力下,多种轨迹提取方法得以诞生.清华大学刘晓东等人成功研制了一种基于计算机系统的运动目标检测、目标跟踪及目标分类的智能监控系统.湖南大学万琴等人提出一种针对固定监控场景的运动检测与目标跟踪方法,利用运动预测技术实现目标匹配,但该方法在复杂环境下对多个目标进行跟踪时算法精确度大幅度降低[5].北航郝久月等人研究了监控场景中运动目标轨迹聚类算法.浙江大学的肖俊等人利用单个摄像机对人体未被遮挡部位的动作进行跟踪.熊荣炎等人通过分析视频序列图像的灰度特征,结合背景差分减法,提出一种静止摄像机条件下,基于特征值快速检测与跟踪目标的方法.

本文着重研究排球比赛视频中球体检测与轨迹提取的精确性、鲁棒性以及实时性等方面的问题.系统针对实际需要建立了基于球体运动方向、运动速度、轮廓参数等信息的多元组轨迹模型.分析并总结了经典的轨迹提取算法的优缺点,有针对性地研究如何利用候选球体的X、Y坐标值分布建立排球轨迹方程,并利用轨迹方程辅助、矫正排球的检测和跟踪,将识别出的球体的运动轨迹提取出来,提升算法运行速度,实现运动轨迹鲁棒提取,并将跟踪结果及运动轨迹以视频帧的形式展示出来.

1.5智能分析模块

智能分析模块可依据对排球运动轨迹变化情况的分析,研究排球比赛中运动员击球行为的检测、击球动作的分类、识别与分析技术等.

2基于视频的排球智能分析系统

2.1系统软硬件架构

基于视频的排球智能分析系统的硬件组成主要是由两个摄像机和计算机组成的双目视觉系统.两台智能摄像机与上位机组成一个局域网,其中PC机作为服务器,两台智能相机作为客户端,系统主要的运算任务如视频图像的采集处理等都在两台摄像机中并行完成,极大地分担了上位机的运算负荷,起到了平衡负载的作用,解决了常规两目视觉中的运算瓶颈问题.本系统中上位机不进行图像处理,只进行简单的运算如三维坐标计算、曲线拟合等.

软件部分使用Intel公司支持的开源计算机视觉库OpenCV提供的函数进行计算机视觉算法方面的开发,采用VC++编程实现运动目标的检测跟踪算法,完成了摄像机及场地的标定、图像序列的获取、排球目标的检测、排球运动轨迹的提取、轨迹特征信息的分析等.

2.2系统实现

系统深入研究双摄像头下排球的识别检测跟踪与轨迹提取方法,为裁判辅助智能分析系统提供有效的数据输入和决策支持,同时满足系统的精确性、鲁棒性、实时性等方面的问题.

本系统采用张氏标定法对摄像机进行标定,分别获取两个摄像机的内外参数,进而用于排球三维坐标的获取.排球视频的采集采用高性能视频采集卡,采集方式有多种,常用的是采用VFW(VideoForWindows)硬件驱动开发包提供的接口或源代码开发.VFW使用简单方便,但可控性差.因此,系统采用基于源码的DirectX完成视频采集,它是微软开发的基于Windows的一组API,通过DirectShow对象创建视频端口,可以灵活方便地操作硬件并获得各种所需的视频数据,实现视频流的压缩传输.系统使用Intel公司支持的开源计算机视觉库OpenCV提供的函数进行计算机视觉算法方面的开发[6],排球检测与跟踪模块采用VC++编程实现,运行于Windows操作系统上.背景差分法的实现过程中结合了排球的形状颜色等特征信息,及时更新背景图像,提高了排球的检测精度.运用形态学滤波去除噪音,并进行高斯滤波平滑图像,实现了排球的检测识别.最后通过卡尔曼预测原理对排球运动轨迹进行跟踪预测,得到排球运动轨迹曲线方程,并将轨迹曲线作为特征信息输入智能分析系统.整个智能分析系统的人机交互界面中可以设定摄像机的帧速率、场地信息等参数.摄像机控制区可控制两个双目摄像机的启动、关闭、捕获和载入视频等.同时,运用Matlab在人机交互界面还可以显示通过双目摄像机得到的排球运动轨迹曲线图[7].

3小结

由于排球比赛视频背景复杂,镜头切换频繁,排球运动过程中其颜色、大小等特征信息会经常变化,且运动目标提取容易受到背景、光线变化、阴影、运动速度等因素影响,因此很难以单个球为对象建立一个有效的模型来检测运动球体.且许多运动对象或者某些区域在外形上与排球很相似,当球与球员和球场线接触或被球员遮挡时,会给球的检测造成很大的困难.因此,为了提高排球跟踪算法的精确性和鲁棒性,降低算法复杂性,必须提出新的目标识别检测跟踪算法,并保证系统的实时、准确、稳定等.此外,由于排球运动中存在自旋以及外界不确定因素的干扰,难以建立准确的运动学方程.因此,如何对一些经典的滤波算法进行改进,提出鲁棒性更高的轨迹获取方法,根据视频帧信息获得排球每时每刻的位置坐标和瞬时速度值等生成排球运动轨迹,也是系统的一个技术关键难题.结合排球轨迹信息,对视频进行更高层的语义分析是下一步需要研究的内容.

参考文献:

〔1〕张虎.机器视觉中二维图像的三维重建[D].北京:北方工业大学,2006.

计算机视觉检测技术范文

关键词机器视觉;现代农业;应用;问题;展望

中图分类号TP391.4文献标识码A文章编号1007-5739(2014)08-0335-01

ApplicationofMachineVisionTechniqueinModernAgriculture

WANGWen-jing

(DepartmentofElectronicInformation,FoshanPolytechnic,FoshanGuangdong528137)

AbstractThebasicconcepts,principleandsystemofmachinevisionwereintroduced.Theapplicationstatusofmachinevisioninmodernagriculturalproductionwasdiscussed.Basedontheanalysisandresearchstatusathomeandabroad,currentproblemsandfuturedirectionofthedevelopmentwasproposedformachinevisionapplicationsinmodernagriculture.

Keywordsmachinevision;modernagricultural;application;problems;prospects

随着“在工业化、城镇化深入发展中同步推进农业现代化”这项重要任务在“十二五”规划中的提出,我国的农业有了迅猛发展,农业与自动化技术的研究和应用得到了高度的重视,但是与国外发达国家还有一定的差距。机器视觉技术是促进农业生产和管理自动化水平提高的一种高效的手段。目前,该技术在国内外农业领域的各个环节已经有了较大突破,如种子质量检测、田间杂草识别、植物生长信息监测、病虫害监测等。机器视觉技术不仅节约了人力、物力的消耗,而且提高了生产质量和效率。

1机器视觉技术的基本概念、原理以及系统组成

机器视觉也称之为计算机视觉,是一种利用机器代替人眼进行观察、测量与判断的技术,首先利用摄像机获取目标的图像,然后通过计算机算法将图像进行数字化处理和颜色、形状和尺寸等的测量与判别[1]。

机器视觉系统主要由光源、摄像机、采集卡和计算机构成。摄像机通过光电传感器将被测物光形象转化为电信号,并且以图像的形式记录保存下来。图像采集卡是连接摄像机和计算机的纽带,主要作用是把电信号转化为数字信号,并将数字信号传输到计算机进行保存和处理。在实际应用中,为了能够获得高亮度和高对比度的图像,通常需要使用光源提供的灯光照明,以便图像的获取和处理。

2机器视觉技术在现代化农业中的应用

2.1在农业生产前的应用

进行种子质量检测。农作物种子质量的好坏对作物产品的优劣与作物产量的高低有着直接的影响作用,在农业生产过程中有着至关重要的地位。成芳等[2]详细介绍了机器视觉系统的原理和发展动态,并且从系统软件、硬件和国内外研究现状等方面综合描述了机器视觉在种子质量检测中的运用。陈兵旗等[3]利用机器视觉技术对水稻种子进行了精选,首先提取长宽比和面积等特征参数,并建立有关稻种类型的数据库,进而对稻种类型进行判断,然后通过扫描线数和扫描线上黑白像素的变化次数来判断种子是否破裂,最后利用不同阈值提取的稻种面积差来判断稻种是否霉变。试验证明:该方法能对种子种类、发霉和破损情况等进行判断,具有较高的准确率。

2.2在农业生产中的应用

2.2.1作物生长信息监测。农作物的生长调控、缺素诊断、产量分析与预测都是以作物生长信息为基础和依据的,因此,通过机器视觉的方法对农作物的生长信息进行监测,成为当今机器视觉在农业中的研究热点之一。张云鹤等[4]设计了农作物茎秆直径变化测量系统,通过测量图像中作物茎秆直径像素数、图像中参照物直径像素数和参照物的实际直径求取作物茎秆直径。使用该系统对黄瓜茎杆进行直径测量,绝对误差在0.002mm以内。王文静等[5]设计了一个基于机器视觉的水下鲆鲽鱼类质量估计系统。该系统利用机器视觉和图像处理技术对不同生长发育阶段的半滑舌鳎进行了检测,提取了鱼的面积、等效椭圆长宽比和圆形度因子等形状参数,并将各参数分别与质量进行数据拟合建立二维和三维维模型。试验证明:该方法能够较好地估计出生物的质量。

2.2.2病虫害与杂草监测。病虫害和杂草直接危害着农作物的生长,如果没有得到及时的控制,会直接影响到农作物的质量与产量。因此,检测并获取害虫的分布情况、位置、生长情况等对农作物的生产具有巨大的意义。邱道尹等[6]设计了一个基于机器视觉的大田害虫检测系统,利用神经网络分类的方法对常见的几类害虫进行了分类。通过现场试验证明,该方法简单可行、识别率高。毛文华等[7]以国内外的研究为例,系统、详细地介绍了机器视觉在杂草识别中的研究和应用情况,分析了采用植物纹理、颜色、多光谱和形状等特征来识别杂草的理论根据以及存在的问题和难点。尹建军等[8]利用摄像机采集标定靶图像,根据摄像机的透视模型对图像进行处理,求出48个靶点质心的像素坐标,然后通过DLT最小二乘法建立摄像机隐参数矩阵。实践证明,该方法对杂草定位的误差在23mm以内,能够满足杂草识别与智能化喷施的需求。

2.2.3营养胁迫诊断。在农业生产管理中,由于缺素初期的作物和正常情况没有太大差别,很难被察觉和诊断,而利用机器视觉的方法能够比较及时、准确的判断,进而降低损失。

毛罕平等[9]在作物营养元素亏缺的识别和自动检测中,利用植物的叶片特征和遗传算法进行优化组合,挑选出能够用在分类器设计方面的特征向量。试验证明,利用二叉树分类法的模糊K近邻法对缺元素的番茄进行识别和测试,其误差在15%以内。张彦娥等[10]利用机器视觉技术和图像处理技术研究了一种温室黄瓜叶片营养信息检测系统,通过求取叶片含水率、含氮率与含磷率分别与各个分量之间的相关性;试验证明:该方法获取叶片颜色分量、亮度指标等参数,能够作为计算机视觉技术作物长势和作物营养信息监测的指标。

2.3在农业生产中的应用

2.3.1农业机器人。对农业机器人的应用主要利用机器人技术进行视觉导航技术的研究,是目前比较受关注的课题之一。视觉导航技术的研究为农业机器人的自动除草、施肥和施药等工作奠定了良好的基础。

周俊等[11]在综合分析农田自然环境的基础上,提出了农业机器人视觉导航中多分辨率路径识别算法,并将色彩特征分析法应用于路径识别中,利用小波分析变化法进行边缘检测,结果表明,结合导航系统期望跟踪的路径特点分析可以比较准确的识别路径。安秋等[12]通过AVR单片机的下位机来控制4个电机的速度和实现与上位机的串口通讯功能,提出了将线性扫描法和最小二乘法结合使用的思路,实现了农业机器人的视觉导航算法,使机器人能够在农作物之间行走。

2.3.2品质分级。利用机器视觉的方法对农作物进行分级,可以减少主观因素的影响,并且为生产自动化的发展奠定了基础。

蒋益女等[13]对苹果质量等级识别的机器视觉检测技术进行了研究,对苹果图像进行梗蒂、缺陷识别后,提取目标区域,并求出纹理和几何特征参数等,并通过Pearson对参数进行相关性分析和SFFS对特征进行选择,去掉冗余的特征,最后使用KNN分类方法对苹果进行分类。试验结果表明,该识别方法对苹果等级识别与人工判别结果非常接近,可以推广到其他产品质量等级检测和识别。李江波等[14]对鲜香菇外部品质计算机视觉检测与分级进行了研究,首先对摄像机采集的图像进行预处理后,获取香菇菇盖的圆形度、最大直径、色调均值等特征参数对香菇进行分级。试验证明,利用BP神经网络法对香菇进行分级的准确度为94.2%。

3存在的问题及未来的展望

随着机器视觉技术的发展和农业自动化水平的提高,机器视觉技术在农业中的应用研究越来越多,但是由于农作物形状的多样性、周围环境的复杂性、理论和实际的差异性等因素制约着机器视觉技术在农业中的应用发展。为了解决这些问题,笔者认为应从试验条件、系统硬件和软件设计3个方面着手。如在设置和模拟试验条件和硬件系统设计时,应多方位、全面地考虑到实际情况和国内外先进技术,使设计更加完善。在系统软件算法的开发阶段,需要将机器视觉和图像处理算法多与神经网络、人工智能等相结合使用,寻求出适用性强的新算法[15]。

在现代农业中引入机器视觉技术,不仅可以提高农业生产和发展的自动化水平,而且可以使人类从重复的劳动中解放出来,有着广阔的发展空间和应用前景。一方面,与人类视觉相比,机器视觉具有快速、非接触性、无损和准确的特点,可以提高农业生产效率,促进农业生产和管理自动化方向和发展。另一方面,计算机、自动化控制技术、机器视觉技术的进一步发展和综合集成,也将会为机器视觉在农业生产中的应用开辟新的空间。

4参考文献

[1]赵晓霞.计算机视觉技术在农业中的应用[J].科技情报开发与经济,2004,14(4):124-125.

[2]成芳,应义斌.机器视觉技术在农作物种子质量检验中的应用研究进展[J].农业工程学报,2001,17(6):175-179.

[3]陈兵旗,孙旭东,韩旭,等.基于机器视觉的水稻种子精选技术[J].农业机械学报,2010,41(7):165-173.

[4]张云鹤,乔晓军,王成,等.基于机器视觉的作物茎秆直径变化测量仪研发[J].农机化研究,2011(12):158-160.

[5]王文静,徐建瑜,吕志敏,等.基于机器视觉的水下鲆鲽鱼类质量估计[J].农业工程学报,2012,28(16):153-157.

[6]邱道尹,张红涛,刘新宇,等.基于机器视觉的大田害虫检测系统[J].农业机械学报,2007,38(1):120-122.

[7]毛文华,王一鸣,张小超,等.基于机器视觉的田间杂草识别技术研究进展[J].农业工程学报,2004,20(5):43-46.

[8]尹建军,沈宝国,陈树人.基于机器视觉的田间杂草定位技术[J].农业机械学报,2010,41(6):163-166.

[9]毛罕平,徐贵力,李萍萍.基于计算机视觉的番茄营养元素亏缺的识别[J].农业机械学报,2003,34(2):73-75.

[10]张彦娥,李民赞,张喜杰.基于计算机视觉技术的温室黄瓜叶片营养信息检测[J].农业工程学报,2005,21(8):102-105.

[11]周俊,姬长英.农业机器人视觉导航中多分辨率路径识别[J].农业机械学报,2003,34(6):120-123.

[12]安秋,顾宝兴,王海青.农业机器人视觉导航试验平台[J].河南科技大学学报:自然科学版,2012,33(3):42-45.

[13]蒋益女,徐从富.基于机器视觉的苹果质量等级识别方法的研究[J].计算机应用于软件,2010,27(11):99-101.

计算机视觉检测技术范文篇12

摘要:研究基于计算机视觉的实时动态手势识别技术,并利用OpenCV计算机视觉库在VS2010平台上设计一个基于该技术在多媒体教学中PPT演示控制方面的应用。首先,利用背景差分法进行手势检测,在背景更新的基础上,通过背景差分图和颜色直方图的反投影图来检测运动手势区域,可以达到较为满意的实时运动手势检测效果;其次,采用基于颜色直方图的粒子跟踪算法进行手势跟踪,基本能满足跟踪的实时性;最后,在手势识别阶段,采用基于Hu不变矩的轮廓匹配算法,得到较好的手势识别效果;使用六种手势,来实现演示文稿中的控制应用。

关键词:计算机视觉;背景差分;粒子跟踪;手势识别;Hu矩

中图分类号:TP391.41文献标识码:A

1引言

随着计算机软硬件技术的发展,人机交互已经由过去的鼠标、键盘方式逐渐向更加灵活生动的语音、姿势等新颖交互方式发展。由于基于视觉方式具有便捷和开销低等优点,因此,利用计算机视觉技术来使计算机理解用户的命令,从而做出控制动作,这一领域的研究得到越来越多的重视。其中,人的手势作为日常生活中最为广泛使用的一种交流方式;因此,国内外许多研究机构开始对手势识别技术进行研究,并已经取得了一些阶段性的成果。较早的有:Freeman和Roth等人提出的基于方向直方图的手势识别系统;国内的高文教授等人于1994年提出了一种静态复杂背景手势目标的捕获与识别。经过二三十年的发展,

人们对运动目标检测及跟踪进行了大量深入的研究:美国MIT实验室通过提取左右手质心的运动轨迹以及手势形状特征参数,结合语法规则识别40个美国手语,准确率达到97%;另外,MicrosoftKorea的HyeonKyuLee,采用HMM的阈值模型,识别9种动态手势命令,平均识别率高达98.19%;国内的任海兵提出了基于DTW的手势识别算法,该算法能准确识别12种手势。

现在,基于视觉的手势识别技术更多的是应用在娱乐、游戏方面,比如微软前段时间推出的Xbox360游戏机体的体感外设Kinect及多款相配套的体感游戏,玩家可以通过手势在游戏中进行操作和互动,使得人机互动娱乐进入了一个新纪元。与此同时,还没有比较成熟的手势识别技术应用在现代教学系统中。因此,本文的研究重点是基于视觉的实时手势识别技术在多媒体教学演示控制中的应用。在基于视觉的手势识别研究中,需要解决的问题主要有两个:一是实时检测运动手势的信息,二是识别运动手势的信息并做出响应。对运动手势检测,本文采用背景差分结合改进颜色直方图特征的运动检测方法[1];对运动手势跟踪,本文采用粒子滤波算法[2]结合改进颜色直方图信息的方法;手势识别阶段,本文采用了基于Hu不变矩特征[3]的轮廓匹配算法[4];本文研究基于计算机视觉的手势识别系统,实现了在播放控制中运用手势进行开始、翻页、退出等功能,极大的提高了课堂教学的灵活性。

2手势检测

实时视频图像中的运动手势检测所需要完成的任务是:能够快且准的检测出手势在实时图像中的主要位置,并且能将位置所在的特定区域作为后续跟踪、识别的感兴趣区域。手势检测算法的好坏,直接影响整个系统的跟踪以及识别的效果。

目前,运动目标检测[5]的算法比较常用的有三种方法:光流法、帧间差分法和背景差分法。本文考虑实现环境为固定摄像头采集实时视频图像,背景基本不动,因此采用背景差分结合改进颜色直方图信息的运动检测方法。

2.1背景差分法

本文研究中,选取摄像头启动后的前10帧图像的平均作为最初的背景图像,把以后的实时序列图像当前帧和背景图像相减,进行背景消去。可以得到,运动手势区域的像素点的差分值比较大,背景区域的像素点的差分值比较小。另外,由于真实场景中的背景会因光线等外部条件产生微小的变化,长期的误差积累会造成最后得不到理想的手势区域,因此背景需要进行实时更新,从而能及时反映当前帧的背景图像,背景更新[6]的公式如下:

背景更新操作以后,对当前帧进行背景差分,大于阈值th1的图像点即为运动手势区域的点,并将得到的运动手势区域图像进行二值化操作,公式如下:

3手势跟踪

现在常用的一些跟踪算法主要有:卡尔曼预测算法、粒子滤波算法、均值偏移算法以及Camshift跟踪算法等。考虑到卡尔曼预测算法和均值偏移算法等都是线性跟踪算法,不能很好的应对目标运动的随机性,本文采用了粒子滤波算法。

3.1粒子滤波算法原理

粒子滤波法是指通过用一组带有权值的随机样本,以及基于这些样本的估算来表示动态系统的后验概率密度。当样本很大的时候,这种估计就等同于后验概率密度。这些样本就称为“粒子”。假设在t=0时刻每个粒子都有一个解,每个解与真实解都有一定的相似度,这个相似度可以表示为权重,随着时间的增加,相似度越大的粒子权重越大,而相似度越小的粒子权重就越小,最后趋于0,从而找到真实解(如图2)。

3.2基于改进颜色直方图信息的粒子跟踪

视频图像跟踪方面,目标的运动模型主要表现为目标位置、速度随时间改变的状态转移过程,目标的观测模型主要表现为每帧图像中运动目标的特征(如颜色、轮廓等)与真实目标的相似度的似然过程。在粒子滤波算法中,运动模型可以称为粒子传播或者粒子采样,它是一种随机过程[11]。粒子在经过传播以后,状态会发生改变,但权值没有跟着改变,这就需要系统的观测模型对当前粒子的状态进行计算从而更新粒子的权值。本文的研究中,观测值由目标区域的颜色直方图决定。

基于颜色直方图信息的粒子滤波就是将图像颜色特征的相似度作为粒子滤波算法要求解的后验概率,利用巴氏距离(Bhattacharyya)来计算相似度,得到粒子的权重。巴氏系数[12]如公式(9):

4.2识别算法过程

本文研究中,首先建立手势模板库,然后通过实时提取手势帧,经过前面第2部分的结合改进颜色直方图信息的手势检测,然后再经过形态学处理之后,得到效果良好手势区域的二值图,再用轮廓提取及跟踪来得到手势的轮廓图,然后计算其7Hu矩特征,最后运用欧氏距离将其与模板库中定义的手势进行特征匹配,完成手势识别。

轮廓提取就是要掏空内部的点:如果其八个相邻的点都是黑色,则可以判定为内部点,然后删除改点。

轮廓跟踪方法:首先找出轮廓中最左下方的点作为搜索的起点,然后按照一定规则来搜索手势轮廓上的其他像素点。由于轮廓是连续的,因此每个轮廓上的点的位置都可以用其前一个点的所张的角度来表示。研究中采用如下跟踪准则,第一个点开始定义搜索方向为左上,如果左上方的点是黑点,则它也是轮廓上的点;如果不是,那么顺时针旋转,直到找到第一个黑点,即轮廓上的下一个点。继续同样的方法搜索,直到返回最初的起点,搜索结束。

下图是轮廓跟踪算法[15]的示意图,搜索方向用箭头表示。

5系统实现

本文的系统是在微软的VS2010平台上,使用C++语言进行软件开发,在图像处理相关方面是基于计算机视觉库(OpenCV)进行研究的。程序界面如下图:

左边底层区的按钮可以观察实时手势跟踪和识别效果的功能(如图4和图7)。

手势识别的结果可以定义成一个变量,不同

的识别结果对应的变量值不同,然后根据变量值调用不同的API接口函数,这样就可以实现实时手势识别技术在演示控制中的应用。本文研究在控制部分挑选了六种手势,分别控制PPT播放中的开始、退出、上下翻页、跳转首末页等功能。手势命令定义如下:手势4控制开始播放;手势3控制退出播放;手势1控制跳转首页;手势2为跳转尾页;手势10为向下翻页页;手势5控制向前翻页。对电脑中某一PPT进行实际的播放控制(列举其中4个手势的控制状态),效果如下:

1)识别手势4,开始播放:

2)识别手势10,向下翻页:

3)识别手势1,跳转到首页:

4)识别手势3,退出:

系统通过笔记本自带30W像素的摄像头,采用DirectShow技术进行实时视频的获取,图像尺寸是320*240,fps可以达到30-60帧/秒,可以很好的满足实时性的要求。

6结语

本文通过研究设计了一个基于视觉的手势识别技术在演示控制中的应用系统,可以看出背景差分结合颜色直方图的运动检测可以得到较好的手势区域效果;采用的基于颜色直方图的粒子跟踪也能基本实现实时跟踪的任务;在识别过程中,基于Hu不变矩的轮廓匹配算法具有很好的鲁棒性,可以得到较好手势识别效果;在应用阶段,使用手势来完成控制命令,基本实现了在播放控制中的应用。

同时,仍存在一些问题:对于光照和人脸微小晃动等外部因素引起的噪声,只能降低而无法消除,这对于手势跟踪与识别的效果还是有一定的影响,在应用时会产生一定的误操作。这些问题仍需继续研究,才能使得基于视觉的手势识别技术得到更成熟的应用。

参考文献

[1]吴晓阳.基于OpenCV的运动目标检测与跟踪[D].杭州:浙江大学,2008.

[2]CHOJU,JINSH,PHAMXD.Objecttrackingcircuitusingparticlefilterwithmultiplefeatures[C]//SICE-ICASE:InternationalJointConference.LasVegas:IEEE,2006:1431-1436.

[3]甘志杰.基于Hu矩和支持向量机的静态手势识别及应用[D].青岛:青岛科技大学,2008.

[4]华斌,夏利娜.基于中值滤波和Hu矩向量的手语识别[J].计算机工程与设计,2011,32(2):615-618.

[5]伏思华,张小虎.基于序列图像的运动目标实时检测方法[J].光学术,2004,30(2):215-217.

[6]LINDEBERCT.Scale-spacetheory:abasictoolforanalyzingstructuresatdifferentscales[J].JoumalofAppliedStatistics.1994,21(2):224-270.

[7]于华平.视频序列中的手势检测与跟踪[D].南宁:广西大学,2010.

[8]QINWEN,PENGQICONG.Animprovedparticlefilteralgorithmbasedonneuralnetworkforvisualtracking[C]//InternationalConferenceonCommunications,CircuitsandSystems.LasVegas:IEEE,2007:765-768.

[9]龚翔.基于粒子滤波的视觉跟踪算法研究[D].南京:南京理工大学,2009.

[10]YUJIAXIA,LIUWENJING,YANGY.Improvedparticlefilteralgorithmsbasedonpartialsystematicresambling[C]//IEEEInternationalConferenceonIntelligentComputingandIntelligentSystems.LasVegas:IEEE,2010:483-487.

[11]朱志宇.粒子滤波算法及其应用[M].北京:北京科学出版社,2010.

[12]FAZLIS,POURHM,BOUZARIH.Particlefilterbasedobjecttrackingwithsiftandcolorfeature[C]//SecondInternationalConferenceonMachineVision.LasVegas:IEEE,2009:89-93.

[13]侯一明,郭雷,伦向敏,等.运动背景下基于粒子滤波的目标跟踪[J].计算机工程与应用,2007,43(8):62-64.

你会喜欢下面的文章?

    年级写人的作文范例(整理5篇)

    - 阅0

    年级写人的作文篇1我最熟悉的人当然是我的弟弟啦,我的弟弟是个瓜子脸,乌黑的眉毛下有一双水汪汪的大眼睛。他还有一张会说的嘴,如果你和他斗嘴,他肯定斗得你无话可说。我弟弟特.....

    党员酒驾检讨书范例(精选3篇)

    - 阅0

    2020年党员酒驾检讨书范例篇1尊敬的交警同志:关于我酒后驾驶的行为,几天来,我认真反思,深刻自剖,为自己的行为感到了深深地愧疚和不安,在此,我谨向各位做出深刻检讨,并将我几天来的.....

    建筑安全管理体制范例(12篇)

    - 阅0

    建筑安全管理体制范文篇1【关键词】工程建筑;施工安全;控制分析项目安全控制是指施工企业对施工项目安全生产进行计划、组织、指挥、协调和监控的一系列活动,从而保证施工中的.....

    高危儿护理诊断范例(3篇)

    - 阅0

    高危儿护理诊断范文篇1【关键词】胎心监护;胎心率基线;胎儿窘迫胎心监护是近年来普及监护胎儿的主要方法之一,能不断地观察胎心率基线变化,辨别胎心率与宫缩胎动的关系,随时发.....

    教师个人工作总结标准模板范文3篇

    - 阅1

    2023年教师个人工作总结 篇1  本学年,本人接手担任学校教学工作。一学期来,我自始至终以认真严谨的治学态度....

    幼儿园教职工培训计划范文(精选5篇)

    - 阅1

    幼儿园教职工培训计划篇1一、培训目标和培训重点坚持以师德建设为中心,以促进教师专业发展为目标,以《指南》....