计算机视觉识别技术范例(12篇)

来源：整理 2024-03-17

计算机视觉识别技术范文篇1

关键词：视觉导航；移动机器人；图像处理

中图分类号：TP242文献标识码：A文章编号：1009-3044(2008)09-11705-01

RobotVisionNavigation'sSummarize

WULin

(LiaoningFinaceVocationalCollegeInformationTechnologyDepartment,Shenyang110122,China)

Abstract:Navigation'stechniqueisthecoreofmobilerobot.Mobilerobothasmanynavigationmethods.Thisthesismakeaanalysisandcontrastamongallkindsofnavigationmethods,itgivesthatbecauseofthedevelopmentofvisiontheoryandmethod,andcomparetolaser,radarandultrasonic,visionnavigationhasmanyadvantages,sovisionnavigationareadoptedinmanyfields.Mobilerobotprocessesthepictureintheprocessofnavigation,thebadofreal-timealwaysisaverytoughproblem.Thekeyofsolvingthisproblembasedondesigningakindoffastpicturetreatmentmethod.

Keywords:visionnavigation;mobilerobot;picturetreatment

移动机器人是一种在复杂的环境下工作的具有自规划、自组织、自适应能力的机器人。移动机器人集人工智能、智能控制、信息处理、图像处理、模式识别、检测与转换等专业技术为一体，跨计算机、自动控制、模式识别、智能控制等多学科，成为当前智能机器人研究的热点之一。

在移动机器人的运动过程中始终要解决的是自身的导航与定位问题，相关技术研究中，导航技术可以说是其核心技术，也是其实现真正的智能化和完全的自主移动的关键技术。也就是DurrantWhyte提出的三个问题：(1)“我现在何处？”；(2)“我要往何处去？”；(3)“要如何到该处去？”[1]其中问题(1)是移动机器人导航系统中的定位及跟踪问题，问题(2)、(3)是移动机器人导航系统中路径规划问题。导航研究的目标就是没有人的干预下使机器人有目的地移动并完成特定任务，进行特定操作。机器人通过装配的信息获取手段，获得外部环境信息，实现自我定位，判定自身状态，规划并执行下一步的动作。

移动机器人的导航方式分为：基于环境信息的地图模型匹配导航；基于各种导航信号的路标导航、视觉导航和味觉导航等[2]。

环境地图模型匹配导航是机器人通过自身的各种传感器，探测周围环境，利用感知到的局部环境信息进行局部地图构造，并与其内部事先存储的完整地图进行匹配。如两模型相互匹配，机器人可确定自身的位置，并根据预先规划的一条全局路线，采用路径跟踪和避障技术，实现导航。它涉及环境地图模型建造和模型匹配两大问题。

路标导航是事先将环境中的一些特殊景物作为路标，机器人在知道这些路标在环境中的坐标、形状等特征的前提下，通过对路标的探测来确定自身的位置。同时将全局路线分解成为路标与路标间的片段，不断地对路标探测来完成导航。根据路标的不同，可分为人工路标导航和自然路标导航。人工路标导航是机器人通过对人为放置的特殊标志的识别实现导航，虽然比较容易实现，但它人为地改变了机器人工作的环境。自然路标导航不改变工作环境，是机器人通过对工作环境中的自然特征的识别完成导航，但路标探测的稳定性和鲁棒性是研究的主要问题[3]。

视觉导航，计算机视觉具有信息量丰富，智能化水平高等优点，近年来广泛应用于移动机器人的自主导航。视觉导航方式具有信号探测范围广，获取信息完整等优点，是移动机器人导航的一个主要发展方向[4]。目前国内外主要采用在移动机器人上安装车载摄像机的基于局部视觉的导航方式，如文献[4]中所提及的：D.L.Boley等研制的移动机器人利用车载摄像机和较少的传感器通过识别路标进行导航；A.Ohya等利用车载摄像机和超声波传感器研究了基于视觉导航系统中的避碰问题等。视觉导航中边缘锐化、特征提取等图像处理方法计算量大且实时性较差，解决该问题的关键在于设计一种快速的图像处理方法或采取组合导航方式[4-5]。

味觉导航是通过机器人配备的化学传感器感知气味的浓度，根据气味的浓度和气流的方向来控制机器人的运动。由于气味传感器具有灵敏度高、响应速度快以及鲁棒性好等优点，近年来许多研究人员在气味导航技术上做了许多研究工作。但该项技术能够真正应用到实际环境中的却很少，仍处于试验研究阶段。FigaroEngineeringInc.公司研制的氧化锡气味传感器，被广泛用于气味导航试验。石英晶体微平衡气味传感器、导电聚合物气味传感器和一种模仿哺乳动物鼻子功能的电子鼻等用于移动机器人味觉导航的传感器都处于试验阶段。目前的味觉导航试验多采用将机器人起始点和目标点之间用特殊的化学药品，如酒精和樟脑丸等，引导出一条无碰气味路径，机器人根据不同的道路跟踪算法，用气味传感器感知气味的浓淡和气味源的方向进行机器人导航试验。味觉导航的研究具有很好的研究价值，该种移动机器人可用来寻找化学药品泄露源。

由于计算机视觉理论及算法的发展，又由于和激光、雷达和超声在导航方面相比，视觉导航具有以下几个优点：首先，即使在丢弃了绝大部分的视觉信息后，所剩下的关于周围环境的信息仍然比激光雷达和超声更多更精确；其次，激光雷达和超声的原理都是通过主动发射脉冲和接受反射脉冲来测距的，因此当多个机器人同时工作时，相互之间可能产生干扰，而视觉由于是被动测量，因此多个机器人相互之间的干扰可以减少到最小；最后，激光雷达和超声数据的采样周期一般比摄像机长，不能及时对高速运动的机器人提供信息并作出规划，因此视觉传感器被大量地采用。目前移动机器人的导航大都采用基于视觉或有视觉参与的导航技术。最近二十年来，在未知或部分未知环境中，基于自然路标导航与定位技术的研究；视觉导航中路标的识别以及图像处理的新型快速算法的研究成为了计算机视觉的主要研究方向。

视觉导航主要完成障碍物和路标的探测及识别。国内外应用最多的是在机器人上安装车载摄像机的基于局部视觉的导航方式。P.I.Corke等对有车载摄像机的移动机器人视觉闭环系统的研究表明，这种控制方法可以提高路径跟踪精度。从视觉图像中识别道路是影响移动机器人导航性能的一个最重要因素。对于一般的图像边沿抽取而言，已有了许多方法，例如，局部数据的梯度法和二阶微分法。Trahanias利用视觉探测路标来完成机器人的导航。其中路标不是预先定义的人工路标，而是在学习阶段自动提取的自然路标。在视觉导航中边缘锐化、特征提取等图像处理方法的计算量大，移动机器人是在运动中对图像进行处理，实时性差始终是一个非常棘手的问题。解决该问题的关键在于设计一种快速图像处理方法。为了满足速度的要求，基于统计计算的预值法被应用于机器人的导航，但在实际应用中发现，它抑制噪声的能力差，特别是预值的选取极大地依赖于环境，要想获得理想的结果，仅在一幅图像中的不同区域就要设置不同的预值。近些年，由于人工智能的发展，有很多好的算法被应用到移动机器人的视觉导航中去。比如，根据导航图像的特点采用边缘提取结合HOUGH变换的方法和带滤波窗的区域扫描的方法，经过检验，这两种算法都具有较好的实时性，对于直线形态的各类导航线以及对于已知半径的弧形导航线具有较高的可靠性，以上算法目前对于分支较多的直线形态的导航线以及未知半径的弧形导航线的效果不佳，这是今后努力的方向。

Stanley还提出了基于神经网络的机器人视觉导航技术。该技术中估算逆雅可比矩阵，并将图像特征的变化与机器人的位置变化对应起来，通过神经网络训练来近似特征雅可比矩阵的逆阵。该技术，通过提取几何特征、平均压缩、向量量化和主成分提取来简化图像处理，实现实时视觉导航。

综上所述，移动机器人是在运动中对图像进行处理，实时性差始终是一个非常棘手的问题。解决该问题的关键在于设计一种快速图像处理方法。将室内地面作为机器人视觉导航的路标。依据地面的颜色信息，将地面上没有障碍物的区域识别并分割出来，机器人在可行走区域内行走，这样就可以实现机器人的自主导航。利用环境中地面的颜色特征，采用比较简单的图像处理算法分割彩色图像，经实验证明可提高机器人导航的实时性、准确性和鲁棒性。

参考文献：

[1]郭戈,胡征峰,董江辉.移动机器人导航与定位技术[J].微计算机信息,2003,19(8):10-11.

[2]吕永刚,谢存禧.移动机器人的导航与路径规划的研究[J].机电工程技术,2004,33(1):19-21.

[3]KennethDHarrisa.Absolutelocalizationforamobilerobotusingplacecells[J].RoboticsandAutonomousSystem,1997,(22):393-406.

计算机视觉识别技术范文篇2

关键词：计算机视觉；跟踪算法；综述；人数统计

中图分类号：TP391文献标识码：ADOI：10.3969/j.issn.1003-6970.2013.03.003

0引言

计算机视觉作为一门多学科的交叉领域，涉及图像处理、计算机图形学、模式识别、人工智能、人工神经网络、计算机、数学、心理学、生理学和物理学等。本文是对视频人数统计技术的综述，属于智能视频监控范畴。

由于智能视屏监控的挑战性以及其巨大的应用价值，越来越多的学校、研究所以及公司的研究人员投入到该领域中来。麻省理工学院、卡内基梅隆大学以及其他国外著名大学成立了专门的计算机视觉及多媒体方向的实验室；Nice和Objectvideo等公司已经针对飞机场、国界线等应用场合开发了一些相应的智能监控系统。国际上的高级视频和录像（AdvancedVideoandSignal-BasedSurveillance）论坛每年都会举办PETS（PerformanceEvaluationofTrackingSystems）会议专门针对于人群行为分析，包括群体人数统计，人流密度估计；对单个人员以及群体中个体进行跟踪；特殊群体和特殊事件检测等。本文主要针对视频人数识别这个研究方向，从基于特征点、颜色与形状信息、模板匹配三种不同类型识别跟踪方式分析了近些年来国内外的研究工作及最新进展，通过对各种不同识别方法比较，对当前亟需解决的问题做了详细的分析。

1人数识别研究现状

人数统计算法融合了运动物体检测、行人检测与分割、形状分析、特征提取和目标跟踪等多个领域的技术。从采用的手段来讲可以分为直接法和间接法：直接法（或称基于检测的），即首先在场景中检测出每个行人，再计数。第二种称为间接法（也称为基于映射或基于度量的），一般是建立场景特征与行人数量的函数关系来测算人数。在行人高度密集的场景中，间接法比直接法更加可靠，主要因为直接法无法有效分割每个行人，特别是在行人高度密集的场景中，从20世纪90年代起到目前为止这近20年里，出现了众多的视觉跟踪算法，1988年，Aggarwal和Nanadhakumar对运动图像分析算法进行了总结，将算法分为两类，一类是基于光流法的分析，另一类是基于特征点的分析，此后在视觉跟踪领域中，又出现了许多新的方法，目前，视频中人数的跟踪方法大致分为三类，分别是基于区域的跟踪、基于特征点的跟踪、基于模板和模型的跟踪，这种分类方法概括了目前大多数视觉跟踪算法，因此下面用这种分类方法对视觉跟踪算法进行介绍。

1.1基于特征的人数识别

基于特征的人数跟踪算法选取目标的某个或某些局部特征作为相关时的对象，这种算法的优点在于即使目标的某一部分被遮挡，只要还有一部分特征可以被看到，就可以完成跟踪任务，另外，这种方法与卡尔曼滤波器联合使用，也具有很好的跟踪效果。这种算法的难点是：对某个运动目标，如何确定它的唯一特征集？这也是一个模式识别问题，若采用特征过多，系统效率将降低，且容易产生错误，文献对这一问题进行了讨论，在特征提取时，一般采用Canny算子获得目标的边缘特征，而采用SUSAN算子获得目标的角点信息。有关基于特征的跟踪算法还可参见文献。在2009年，Albiol使用角点个数作为场景特征来估测人数，首先通过Harris角检测器检测出图像角点，然后进行角点匹配以区分人身上的角点和背景角点，Albiol认为每帧总人数与人身上角点的个数成正比例关系，以此估测人数，算法虽然简单，但在PETS2010“人数统计与密度估计”竞赛中取得优胜。2010年，Conte等“”基于Albiol的方法提出改进。采用的SURF（SpeedupRo.bustFeature）特征点以代替角点，同时，Conte等不仅考虑到特征点个数对人数估测的影响，还考虑到透视投影（拍摄距离d）密度人群遮掩（特征点密度p）对于估测的影响，同时对所有SURF点进行分组回归以提高精度，在这个基础上张茂军等相比Conte等的研究成果在处理远距离人群上精度提高，主要因为使用“非最大抑制聚类”——对不同拍摄距离的人群采取不同的聚类标准，有效解决远距离人群的类过大问题，提取人身上特征点的方法是在掩模上直接检测特征点，使得特征点个数更加稳定，有利于SVM预测。

1.2基于区域的人数识别

基于区域的跟踪算法基本思想是：首先得包含目标的模板（Template），该模板通过图像分割获得或是预先人为确定，模板通常为略大于目标的矩形，也可为不规则形状；然后在序列图像中，运用相关算法跟踪目标，对灰度图像可以采用基于纹理和特征的相关，对彩色图像还可利用基于颜色的相关。

McKenna等首先利用色彩和梯度信息建立自适应的背景模型，并且利用背景减除方法提取运动区域，有效地消除了影子的影响；然后，跟踪过程在区域、人、人群三个抽象级别上执行，区域可以合并和分离，而人是由许多身体部分区域在满足几何约束的条件下组成的，同时人群又是由单个的人组成的，因此利用区域跟踪器并结合人的表面颜色模型，在遮挡情况下也能够较好地完成多人的跟踪。Marana等认为低密度人群在图像上体现出粗糙纹理特征，而高密度人群则体现出精细纹理特征。文献分别采用自组织理论和Minkowsld不规则维度理论从图像纹理特征预测人群密度。Lin等则结合Harr小波变换（HWT）和支持向量机（SVM）进行行人头部轮廓检测，从而达到人数统计的目的。文献利用颜色和形状信息实现人头的检测，包含两个步骤：黑色区域提取和形状分析。通过对HSV空间V通道的像素设置阈值这种方法有效地检测出黑色区域，同时可以少受光照变化和阴影的影响。使用一种基于形状描述的快速弧形结构提取方法实现人头检测。姬红兵等提出了一种基于局部特征的目标跟踪算法，通过多尺度分析方法，根据颜色和空间上的相似性将目标分割为多个区域，每个区域由一个团块表示，团块包含了该区域所有像素的颜色均值、形状和位置，根据团块特征构造目标的外观模型，定义团块的匹配准则，通过团块匹配进行目标跟踪。

1.3基于模板匹配的人数识别

采用模板匹配识别跟踪方法首先将图像序列转换为一组静态形状模式然后在识别过程中和预先存储的行为标本相比较，

部分学者在运动前景提取的基础上使用了轮廓匹配方法对目标进行定位，文献使用了半圆模型搜索前景中人头肩所在位置，然后使用Snake模型与卡尔曼滤波相结合对目标进行跟踪目标，但Snake模型比较适合单目标的跟踪，当行人发生重叠时，定位精度会有一定的下降；在此基础上文献提出使用含有人harr特征分类器（使用头肩部上半身样本），对行人重叠情况下的检测精度有一定的提升。文献提出使用垂直摄像头降低行人之间的遮挡程度，通过对基于AdaBoost的人头检测本方法，建立一个良好的人头检测分类器。然后根据运动人头的特征去除误检区域。最后配合过线跟踪实现出入口人数统计。

2视频跟踪问题中的难点

从上面的阐述可以看出，各种方法都有自己的优点和不足，是在文献基础上分析得到的几种具体识别方法的比较结果，由于各种方法在设定理想情况下都有较好的准确率，所以不对各种方法的准确率做出比较，而是从各种算法的复杂度、鲁棒性、先验知识需求、高密度复杂人群适应性（有遮挡出现）等方面进行相对的比较分析，分析结果如表1。

2.1视觉跟踪问题中的难点

从控制的观点来看，视觉跟踪问题所面临的主要难点可以归结为对视觉跟踪算法在三个方面的要求，即对算法的鲁棒性、准确性和快速性。

鲁棒性是指视觉跟踪算法能够在各种环境条件下实现对运动目标持续稳定的跟踪。影响人数跟踪系统鲁棒性的最主要原因在于目标处环境的光照变化以及部分遮挡引起的运动目标不规则变形和全部遮挡引起的目标的暂时消失。当运动目标所处环境的光照发生改变时，采用图像灰度信息或色彩信息作为跟踪基础的视觉跟踪算法一般都会失效，而基于图像特征的方法往往不受光照改变的影响，如利用运动目标的边缘信息能有效避免光照变化对运动目标的影响，但在复杂环境中要将运动目标的边缘和周围其它目标边缘区分开来是非常困难的，遮挡问题是视觉跟踪算法中又一难点问题，利用单摄像机解决遮挡问题也一直是视觉跟踪领域中的热点。而利用多摄像机可以在很大程度上解决这一问题，但正如前所述，多摄像机的应用又会引入新的难题。

在视觉跟踪研究中，准确性包括两个方面，一是指对运动目标检测的准确性，另一个是指对运动目标分割的准确性，对运动目标检测准确性的目的是尽量避免运动目标虚检和漏检，从而提高对真实运动目标的检测概率。由于实际复杂环境中存在大量噪声。至今已经出现了上千种各种类型的分割算法，但由于尚无通用的分割理论，目前并没有一种适合于所有图像的通用分割算法。

一个实用的视觉跟踪系统必须能够实现对运动目标的实时跟踪，这就要求视觉跟踪算法必须具有快速性但是，视觉跟踪算法处理的对象是包含巨大数据量的图像，这些算法往往需要大量的运算时间，很难达到实时处理的要求，通常，简单算法能够实现实时跟踪，但跟踪精度却很差；复杂算法具有很高的跟踪精度，实时性却很差，一种通用的减小视觉跟踪算法运算量的方法是利用金字塔分解或小波变换将图像分层处理。

3展望与结束语

3.1展望

实现一个具有鲁棒性、准确性和快速性的视觉跟踪系统是当前视觉跟踪技术努力的方向。但视觉跟踪技术在这几个方面中每前进一步都是非常困难的，因为该技术的发展与人的感知特性的研究紧密联系在一起，由于目前对人的感知特性没有一个主流的理论，其数学模型更是难以建立。同时，在计算机视觉中大多数问题是不确定的，这就更增加了视觉跟踪技术发展的难度。但是，近几十年来，数学理论方面取得了巨大的进步，因此合理的使用在数学理论方面的知识提高系统的性能能够很好的解决视觉跟踪问题。例如现在已经应用在诸多领域的模糊算法，神经网络等提高系统性能，简化计算复杂度。

3.2结束语

计算机视觉识别技术范文篇3

关键司：地铁；车辆基地；车号识别；深度学习；目标检测

1引言

伴随计算机及信息技术的发展，以全自动驾驶车辆为代表的新技术为城市轨道交通注入新的活力。为提高全自动驾驶车辆检修作业的信息化水平，完善车辆检修基地的信息化建设，将全自动驾驶车辆基地自动驾驶区综合管控系统所产生的监测数据与对应车辆进行绑定，即可形成特定车辆的专属“病例”档案，便于检修管理决策以及车辆性能改进。而要实现上述目标，就必须完成车辆编号的自动识别。车辆编号自动识别技术的实现主要经历了射频技术与电子标签结合、图像识别技术等阶段，但由于涉及车辆结构改造以及易受异物影响等原因，使用效果均不理想。随着大数据技术的发展，深度学习技术逐渐在车号识别研究领域有所应用。胡路路、张亮等采用目标检测算法、文字检测网络（ConnectionistTextProposalNetwork，CTPN）模型实现了车辆编号的识别，准确率超过95%。但该种方法模型迭代次数极高，需要大量的样本数据提高识别准确率。

2车号识别系统技术简介

本文基于深度学习、目标检测、机器视觉和光学字符识别（OpticalCharacterRecognition，OCR）等技术，研发新型车号识别系统。该系统利用车辆标志与编号相对位置固定的特点，大幅减少模型训练所需的样本数量。

2.1深度学习技术

深度学习是机器学习的分支，是一种以人工神经网络为架构，对资料进行表征学习的算法。本系统使用的深度学习技术框架为Darknet。Darknet深度学习框架支持中央处理器（CentralProcessingUnit，CPU）和图形处理器（GraphicsProcessingUnit，GPU）计算，且支持开源计算机视觉库（OpenSourceComputerVisionLibrary，OpenCV）和共享内存并行编程（OpenMulti-Processing，OpenMP），同时Darknet框架具有结构清晰，源代码查看、修改方便的优点。

2.2目标检测技术

目标检测是计算机视觉及影像处理中的术语，指的是让计算机去分析1张图片或者1段视频流中的物体，并标记出来。本系统使用YOLO目标检测算法，其算法示意图如图1所示。YOLO算法将输入图像缩放成统一大小的尺寸，利用整张图片作为输入进行特征的提取，将最后的特征图划分为S×S个网格，每个网格可以看成是1个候选框，每个候选框包含了4维位置坐标信息和1维目标类别置信度，然后分别对每个网格进行目标分类和边框回归，实现目标搜索。

2.3机器视觉技术

机器视觉是配备有感测视觉仪器（如自动对焦相机或传感器）的检测机器，可用于检测产品缺陷、判断并选择特定物体，或用于测量尺寸等，大量应用于工厂自动化检测及机器人产业中。

2.4光学字符识别技术

OCR是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。本系统使用开源算法Tesseract。支持Tesseract的Leptonica组件有着优越的图像分析性能，保证文字识别的精度。除此之外，Tesseract还具有多平台的可移植性，拥有庞大的Unicode字符识别库。OCR检测与文本识别主要包含图像预处理、版面分析、图像切分、特征提取与模型训练、识别后处理等，其流程如图2所示。

3系统工作流程

基于上述技术，本文研发的基于深度学习目标检测的车号识别系统主要由高速摄像头、光电反射车感器、边缘计算机及信息传输模块组成，工作流程如图3所示。（1）在列检库司机登车平台端部，采用可调节吊杆机构吊装车号识别摄像机，使其能够在车辆经过时在同一画面中拍摄到车辆的标志（LOGO）和车号，车号识别摄像机安装位置如图4所示。在该股道车辆入库位置部署1台边缘计算机和1个光电反射车感器，地铁车辆经过时触发车感器，边缘计算机通过车感器检测到车辆到来，触发摄像头录制短视频。（2）边缘计算机内置检测程序，使用深度学习目标检测技术逐帧检测视频是否拍到车辆LOGO，如果没有检测到则判定为车感器误触发；如果检测到车辆LOGO，则通过检测程序计算得到LOGO在图像上的位置和像素尺寸大小。（3）根据车头正面LOGO与车号之间的相对位置和大小比例关系（预置在检测程序中），基于机器视觉技术计算出车号在图像上的位置和大小，找到车号位置，图像裁减后使用OCR算法进行文本识别，得到车号数据。由于摄像头不可能安装在车头正前方，车号图像会有变形，裁减车号位置的图像后，可通过透视变换矫正图像，以改善图像变形对识别结果的影响。（4）边缘计算机按照通信协议要求将车号数据、车感器被触发的时间以及边缘计算机编号通过网络发送给上级服务器。上级服务器据此形成特定车辆的位置记录。地铁车辆的车头部分标识了车辆编号及车辆LOGO，如图5所示。不同车辆的车号不同，但LOGO的位置及形状固定不变。系统在策略上的与众不同之处在于，不直接识别车号，而是先识别出LOGO，根据LOGO与车号之间的位置关系，找到车号所在区域，然后再识别车号。由于LOGO是固定不变的目标，相比车号的识别准确度会更高，深度学习时所需要的样本更少，训练速度更快。

4系统现场测试结果

依托南宁地铁那洪车辆基地的建设，实施全自动驾驶车辆基地作业综合管控系统。其中停车列检库的车号识别系统安装完毕后，在现场进行为期2个月的调试测试，数据统计结果如图6所示。由图6可知，测试前期识别成功率曲线波动较大，成功识别车号数量较少；随着调试过程的推进，识别成功率逐渐上升，并趋于稳定，但仍有个别数据波动产生。通过故障分析显示，个别股道未能成功识别车号的原因均为车感器未被触发、摄像机未拍摄录像等硬件设备原因，除此之外，在硬件设备正常运转、摄像机正常工作的其余股道，车号识别系统均正确识别出所在股道的车辆车号。在调试后期，系统的识别准确率也趋于稳定。

5结论

计算机视觉识别技术范文篇4

【关键词】计算机设计图形图像视觉侦查分析研究

应用计算机实现的图形图像设计与视觉侦查，在实际生产与生活中出现的时间都相对比较早，其中计算机视觉侦查应用实现的时间更是早于计算机图像图像设计，与一般的平面设计技术相比，通过计算机实现的图形图像设计在实际设计应用中不仅内容更加丰富，并且图形图像中所包含的元素也相对较多，因此所能够传达和表示内容含义也就更为全面。此外，应用计算机实现的图形图像设计不仅能够更进一步的传递出现代图形设计的目的，在设计过程中还能够借助计算机相关技术实现数据信息的分析处理，从而使图形图像设计者的想法愿望能够更好的呈现出来，具有突出的作用优势和意义。

1计算机图形图像设计与视觉侦查的相关概念概述

在图形与图形设计领域中，计算机图形图像设计的出现应用相对比较早，最早可以追溯到20世纪80年代，我国的计算机图形图像设计是在引进外国设计经验与理论基础上实现应用的。对于图形图像设计含义的理解，首先应从图形图像的含义理解开始，它是指通过图形图像或者是视觉形象实现设计者思想观点的表现和阐述，其本身具有较为突出的创造性特征，因此，图形图像设计是指设计者通过使用相关媒体实现特定信息的视觉形象的传递，它是一种特殊的语言形式，在设计领域比较受欢迎。视觉侦查则是在图形图像设计过程中借助视觉传达的相关技术手段实现图像图像视觉效果的分析判断，视觉侦查的概念比图形图像设计概念出现的时间要早，它是指人们通过信息符号的运用实现相互之间的交流和沟通，是一种实现人与人之间沟通交流的工具。计算机图形图像设计与视觉侦查之间有着密切的联系，其中计算机图形图像设计是通过计算机技术对于视觉信息中的图形图像相关信息进行再次创作实现的一个过程，借助视觉侦查能够实现计算机图形图像的更好设计。

2计算机图形图像设计与视觉侦查的特征关系分析

（1）计算机图形图像设计的特征分析。在设计领域中，图形图像设计和艺术设计之间有着很大的联系，根据上述对于图形图像设计概念含义的概述，结合实际设计应用情况可以将图形图像设计的特征概括总结如下。首先，在实际设计应用图形图像设计所实现的任何设计都需要相应的经济基础作为支撑，以商业性广告的设计为例，其设计就是把实现最大利益作为目标而进行的，而那些不具有商业性质的公益设计类型，也具有相关的社会关怀、文化氛围营造等不同目的，因此，实际设计应用中为了更好的实现设计的目的，就需要在经济基础的支撑下结合设计受众的心理喜好，以达到更好的设计目的。其次，在实现图形图像设计过程中需要设计者对于设计内容的基本思路以及设计核心内容、目标等进行明确，以实现图形图像设计主题思想的确定，达到设计目的与要求。再次，进行图形图像设计中还需要认识到图形图像设计与一般的美术画画之间有着根本的区别，其中美术画画对于所画事物之间的一致性要求比较高，而图形图像设计则是选取容易被人们所接受、喜爱的事物作为载体的，与日常生活联系比较密切。此外，在设计领域中，计算机所实现的图形图像设计自身属于一种定量式的设计，每个设计之间是相互独立的，其设计目的也更为明确，设计速度比较快，设计过程中的定位与配色等都比较精准，所实现的设计带给人们的视觉冲击性也比较强，再加上计算机技术的应用，不仅促进了图形图像设计中的设计绘制软件工具的革新，而且很大程度上也拓宽了图形图像设计的视觉传达效果，能够促使设计者的设计创意与设计表现实现更高层次的突破提升。如图所示，即为应用计算机图像设计软件实现的设计效果示意图。

（2）计算机图形图像设计与视觉侦查之间的关系区别分析。结合计算机图形图像设计的实际情况及其设计的视觉传达效果，在实际设计中图形图像设计和视觉传达设计之间的设计相同点比较突出，其中，以设计内容和设计目的为例，其中就存在着很大的共通性，在实际设计中对于设计者都具有较高的专业知识和软件应用要求。此外，在对于计算机软件技术的应用上，图形图像设计和视觉侦查之间所需要的软件都是一样的，像比较常见的Photoshop等，并且完成设计都需要设计者具备相关的审美与对设计元素的灵活应用，在完成设计作品的再创造基础上，实现设计质量效果与水平的提升。其次，图形图像设计与视觉侦查之间也存在有较大的区别，其中图形图像设计更加重视对于图形和图像的设计处理，而且视觉侦查则是通过视觉的设计构造，体现出更特别、更新颖的观念思想，因此视觉侦查更加重视设计者的创意和创新，由于图形图像设计与视觉侦查之间的这种根本性的区别，就导致了视觉侦查与图形图像设计在设计手法与设计原则上也存在有一定的区别，这也是图形图像设计与视觉侦查之间的最大不同处。

3计算机图形图像设计与视觉侦查的应用分析

根据上述对于计算机图形图像设计与视觉侦查特征与关系区别的分析，就可以看出在实际设计应用中，视觉侦查与图形图像设计之间具有很大的关联性，它们通过相互之间的作用影响，共同实现设计者思想与观念的展示表现。通常情况下，计算机图形图像设计与视觉侦查在文字设计以及广告设计、绘画设计、包装设计和功能界面设计中的应用体现比较多，以文字设计为例，其中有关的文字大小以及字体颜色、位置、效果等，都是借助计算机图形图像处理软件完成实现，并且借助这种设计手段，最终都是为了对受众产生相对突出的视觉冲击。

结语

总之，计算机图形图像设计与视觉侦查作为计算机设计领域重要内容，对于计算机技术的提升以及艺术设计的发展进步都有着积极的影响和意义，进行计算机图形图像与视觉侦查的分析，有利于促进计算机技术与艺术设计的发展提升。

参考文献

计算机视觉识别技术范文篇5

关键字：数字媒体数字媒体应用数字技术

数字媒体艺术专业是当代科技和艺术高度结合并涉及多学科交叉，它包含了计算机、艺术、文化、教育、科技、现代经营管理等广泛内容。随着计算机技术以及应用的发展，在世界信息化、国际化的背景下，数字影像、数字图书等数字出版、网络信息和文化传播、网络教育、网络推广等数字媒体应用在商业和教育中的应用日益增强。与此同时，动漫开发与设计、游戏开发与设计、影视特效等数字媒体艺术中的应用也得到了前所未有的发展。

1、数字媒体与数字媒体艺术

1.1数字媒体定义

有国家科技部组织863专家制定的《2005中国数字媒体艺术发展白皮书》在2005年12月份，白皮书中从新定义了“数字媒体”的概念。数字媒体是以信息科学和数字技术为主导，以大众传播理论为依据，以现代艺术为指导，将信息传播技术应用到文化、艺术、商业、教育和管理领域的科学与艺术高度融合的综合交叉学科。数字媒体包含了图像、文字以及音频、视频等各种形式，以及传播形式和传播内容中采用数字化，即信息的采集、存取、加工和分发的数字化过程。数字媒体已经成为继语言、文字和电子技术之后的最新的信息载体。

1.2数字媒体艺术

数字媒体艺术主要包括研究数字媒体的表示，处理、显示、记录、存储、传输、管理等各个环节的软件与艺术相结合的一门学科，融合计算机技术、数字信息处理、网络技术数和字通信等现代计算和通信手段，综合处理声音、图形、图像、文字等信息，使抽象的信息变成可感知、管理和交互的信息的软硬件技术。

2、数字媒体艺术研究的主要方向

数字化、信息化时代不断深入也迫使了媒体传播方式的本质的改革，诞生了包括数字图像、数字音频、数字影像、网络媒体和移动媒体等在内的多种数字传播媒介形式。这种变革给现代社会经济、文化、生活也带来了极大的促进，使之成为科学与艺术、媒体与设计、各媒体形式学科间交叉与综合的新的艺术形式，数字媒体艺术的出现打破了传统学科专业的划分，使得诸如动画、DV、电影、电视、因特网和流媒体等“技术的艺术”首次有了统一的技术形态和视觉艺术语言。

2.1数字图像处理技术

图像处理就是将图像转化为数字矩阵存放在计算机存储设备中，并采用一定的算法对其加工处理。图像处理技术的根本是数学，其核心不费为各种算法的设计和实现。图像处理技术涉及众多领域。如计算机科学、医疗、教育、科技、各业等领域。因各领域对数字图像处理的应用方向不一，大致分为：图像数字化：通过计算机采样和量化将图像变成能够为计算机处理的数字形式；图像的增强和复原：是指放大图像中的需要的信息，剔除图像中不需要的部分，让图像更接近所需；图像编码：在满足一定的保真条件下，对图像进行编码处理，达到压缩图像信息量，简化图像的目的。以便于存储和传输；图像重建：实现从新采样来构建图像。图像重建有代数法、傅立叶反投影法和使用广泛的卷积反投影法等算法；模式识别：用于图像的识别。例如：人脸鉴别、指纹识别等是模式识别的内容。目前主流的模式识别方法有：统计识别法、句法结构模式识别法和模糊识别法。

2.2数字音频处理技术

数字音频处理技术主要是指通过计算机对音频的采样、量化、编码将音频转化为数字方式存储在计算机中，数字音频编码压缩技术主要包括：基于音频数据的统计特性的编码技术；基于音频的声学参数的编码技术；基于人的听觉特性的编码技术。数字语音处理同样也是数字音频目前研究和应用的主要领域，主要包括语音识别、处理技术。

2.3数字图形技术

计算机图形就是指使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的技术。主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。目前应用领域非常广泛，如曲线曲面造型、、实体造型、图形硬件、光栅图形生成算法、图形标准、图形交互技术真实感图形计算与显示算法，以及计算机动画、虚拟现实、科学计算、可视化自然景物仿真等。

2.4数字视频处理技术

数字视频是以数字形式记录的视频，和模拟视频相对的。数字视频有不同的产生方式，存储方式和播出方式。比如通过数字摄像机直接产生数字视频信号，存储在数字带，P2卡，蓝光盘或者磁盘上，从而得到不同格式的数字视频。然后通过PC，特定的播放器等播放出来。它视频压缩压缩技术分为有损、无损两种。可以用多种不同的方法和策略压缩数字视频文件，使之达到便于管理的大小。下面是几种最常用的方法：心理声学音频压缩、心理视觉视频压缩等方法。

2.5数字媒体存储技术

数字媒体存储对计算机性能较高，经过处理后图形、图像、语音、视频等通过数据量较大，同时具备实时性和并发性，所以在考虑数据存储技术不仅仅要考虑存储介质，还需考虑存储算法。正是数字媒体对数据的传输、读取有高标准和高要求，这也使得计算机媒介相关控制接口、技术等方面得到了快速的发展，各种快捷的接口、高速大容量的存储设备不断出现并得到了大量的使用，这也恰恰促进了数字媒体艺术的发展。

3、数字媒体艺术未来发展趋势

目前3亿多中国网民常常观看在线视频的现状，预示着在线视频即将成为产生数字媒体广告预算的主力引擎之一。在我国社交网站（SNS）注册用户已经超过1.5亿人次，大约1/3的网民都在使用SNS；各大主流互联网媒体纷纷向社交化转型，众多SNS新平台和产品竞相登场。社交媒体和视频类平台成为数字媒体艺术未来发展的新方向。将数字媒体的产品服务和创新技术融入品牌的市场推广体系，最大化数字媒体的营销效果；现有广告主、商、媒体主以及其他各方角色如何在新媒体市场中迅速找准定位，利用现有业务的优势拓展新市场，成为当前数字媒体行业持续发展亟需回答的问题。

参考文献：

计算机视觉识别技术范文1篇6

一、计算机视觉检测技术含义

计算机的视觉又叫做机器视觉，通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程，从而进行三维世界的感知活动。计算机的快速发展，离不开神经心理学，心理学和认知科学方面的研究和发展，计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力，计算机不仅能感知到周围的总体环境，而且，还能够具有对物体进行描述，识别理解和储存的能力。

二、计算机视觉检测的基本原理

要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤：图像预处理（去除噪声）、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次：图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉（Computervision）则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。

作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有：（1）计算出观察点到目标物体的距离；（2）得出观察点到目标物体的运动参数；（3）甚至可以判断出目标物体的内部特性；（4）推断出目标物体的表面特征有时要求形成立体视觉。

三、亚像素检测技术

随着工业检测等应用对精度要求的不断提高，像素级精度已经不能满足实际检测的要求，因此需要更高精度的边缘提取算法，即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的，这些算法一般需要先用经典算法找出边缘像素的位置，然后使用周围像素的灰度值作为判断的补充信息，利用插值、拟合等方法，使边缘定位于更加精确的位置。现在的亚像素提取算法很多，如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同，他们的应用场合也是各不相同的。

边缘是图像的基本特征，所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合，边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程，边缘的定位精度直接影响最终的测量结果。因此，图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中，早期使用的都是像素级边缘检测方法，例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度，即可以判断出边缘位于某个像素内，但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大，就会产生较大的误差，传统的整像素边缘检测方法就不再适用。

四、计算机视觉检测技术在机加工零件检测中的应用要素与过程

（一）曲阵CCD相机

面阵CCD是本项目图像采集系统中的主要设备之一，其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。

（二）工业定焦镜头

在图像测量系统中，镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能，合理选择并安装光学镜头是图像测量系统设计的重要环节。

（三）数字图像采集卡

随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用，使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能，同时还具备部分图像处理功能，因此又可以称之为图像处理卡。

（四）标定板

为提高测量精度，需要进行摄像机标定。标定过程中，采用NANO公司的CBC75mm}.0型高精度标定板，外形尺寸为75mmx75mmx3.0mm，图形为棋盘格，其尺寸为2.0mmx2.0mm，精度为1级，即图形尺寸精度与图形位置精度为。

（五）背光源

背光方式只显示不透明物体的轮廓，所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此，为精确提取轴的图像中的边缘特征，需采用背光源。为使图像边缘更锐利，光源颜色选择红色。

五、结语

随着计算机技术和光电技术的发展，已经出现了一种新的检测技术―基于计算机视觉的检测技术，利用CCD摄像机作为图像传感器，综合运用图像处理等技术进行非接触测量的方法，被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器，研究了零件在线测量的方法，实现了零件尺寸的图像边缘亚像素定位测量，对面阵CCD在高精度测量方面的应用作了进一步的探索和研究，为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。

【参考文献】

计算机视觉识别技术范文篇7

关键词OpenCV；科学教育；推广价值

1、OpenCV库简介

OpenCV是由Intel微处理器研究实验室的视觉交互组开发的一个跨平台计算机视觉库，它的代码都是开源的而且都经过非常好的优化，并且具有很好的移植性，可以根据需求导入到合适的环境中使用。它可以实现有关图像识别与处理和计算机视觉技术方面的很多通用算法。它的优势是可以运行在当代社会使用热门的各大操作系统上，适用性强，还可以脱离外部库而独立运行。OpenCV的C和C++都是经过优化的开源代码，采用灵活的接口，提升计算机的运行速度。其中包含的函数就有500多个，包括的种类有C和C++等。OpenCV因为免费面向市场，已经被社会各界广泛使用。现已应用于人机互动、图像识别、图像分割、目标追踪、3D重建、机器视觉、结构分析等数个领域。OpenCV主要包括以下几个部分：①cxcore:核心功能模块，包含一些基本函数，运用于各种数据类型的计算。②cv:图像处理和计算机视觉功能。③ml:机器学习模块，主要内容是分类器。④cvaux:包括大部分实验性的函数，例如ViewMorph-ing、三维跟踪、PCA、HMM等。⑤Highgui:图像界面接口，支持摄像头的读取和转换。

2、OpenCV处理图像的功能

OpenCV中有很多的函数，可以实现很多不同的功能，其中最具有学习价值的部分就是图像处理。处理图像主要分为三部分：加载图像，显示图像，处理图像。

2.1加载图像

不同类型的图像有着不同的内部结构。我们需要根据图像的结构采用合适的方法将图像文件中的数据读入内存。OpenCV中的cvLoadImage()函数，可以加载图像数据。而且图像的格式不影响加载的效果，加载后它以一个指向IplImage结构体的指针形式返回，大大方便了后续处理的过程。2.2显示图像加载图像后需要通过函数使其显示。cvNamedWindow()函数由HighGUI库提供，它可以在屏幕上创建一个窗口，将图像显示出来。cvShowImage()函数的作用是在这个创建的窗口中显示出加载过后的图像。观察图像时经常用到的重要函数还有可以使程序暂停的函数cvWaitKey()，以及用于释放内存的函数cvReleaseImage()和cvDestoryWindow()，掌握并运用这些函数，就可以轻松的实现观察图像的功能。

2.3处理图像

OpenCV中包含的多种函数，可以达到图像处理技术方面的很多效果，包括图像灰度化函数cvtColor（），边缘检测函数Sobel（）、Laplacian（）、Canny（），其中Canny算子只能处理8位灰度图，其余两种8位32位都可以，合并梯度函数addWeighted（），放大缩小函数resize（），阈值化操作函数imshow（）等等。适当选用合适的函数并加以运用即可达到目标所需。

3、OpenCV的推广价值体现

OpenCV可以应用在社会的各个领域，价值就体现在每个科学的产物当中。举个近在身边的例子，随着社会的发展，生活质量的提高，人们的居住环境也在逐渐改善，楼层越盖越高，无数摩天大楼，商业大厦群起而立，电梯已经成为了我们日常生活中必不可少的工具。尽管现在电梯的功能、质量不断地提升，但是仍然存在些许不足，当我们在学校的教学楼内等电梯时发现了一个问题，那就是在电梯使用的高峰期时，比如在上下课时段，有很多人都在同一楼层等电梯。但是此时只有一台离该楼层最近的电梯会过来，而其余的电梯都会自动向其它叫梯楼层运行或是闲置。可是此时这一台电梯只能容纳有限数量的人，时常不能使所有人坐上电梯，这样就无法满足全部人的需求，由此就导致了有部分人无法及时地坐上电梯，需要继续等候，而闲置的电梯又不能及时地被利用。这样不仅不能合理地利用资源，反而浪费了许多不必要的时间。因此，我们想到可以通过利用图像识别与处理的方法来弥补这个不足，首先通过硬件设备连接拍照捕获候梯人像，后台运行判断出候梯人数，然后运用语言编程来确定调动电梯的个数，从而来达到实现自动控制每个电梯的运行的目的，使所有人都能在第一时间乘坐电梯。而上文中提到的OpenCV就可以完成这项艰巨的任务。我们将OpenCV导入编程环境，其次修改电梯工作系统的运行程序，将软件与硬件设备相连通，这样通过调度程序，就可以轻松高效地解决这个问题。使用这种方法，不仅可以节约人们的候梯时间，方便学生、老师上课，而且可以合理有效地调度电梯，使电梯的价值得到最大化。见微知著，OpenCV可以应用在每个领域，对各界的发展起到推动作用，造福社会的科技发展，方便人们的生活。

4、科学教育存在的问题

在历年的教学模式中，老师们往往会强调理论知识的重要性，但却忽略了对学生使用动手能力的培养，学生不能独立完成实践性的技术操作，也就是说教学模式缺乏实践性。只有将理论与实践相结合，才能实现知识价值的最大化，因此，应当在教学中配合着实践课程，举一反三，让学生们更加深刻地学习和了解所学到的知识。而如今虽然一部分学校也开设了实践课程，但也只是浅尝辄止，并没有过多地讲授计算机技术实践方面的知识，学生们也没有真正拥有动手实践能力，这使学生们的技术知识十分受限。虽然现在多数学生对计算机略懂一二，但是实际上仅仅会使用类似Word等简单的软件，而技术要求较高的一些软件及工具却全然不知，甚至对自己所学过的课程软件的使用也是马马虎虎，这对于未来工作所需的能力来讲，实在是九牛一毛。目前中学生使用电脑的重心更多放在了社交软件和游戏上，很少有人利用计算机学习更多的技能，这对青少年的发展实在是利大于弊的，而且这样也失去了计算机的正向价值。因此，我们应该改变现有的教学模式，一边教授理论知识，一边配合指导学生动手操作，将理论与实践相结合，也能让学生更好地消化和吸收所学到的知识，并且引导学生正确使用计算机，发挥计算机的价值，让学生们都能够在计算机中获得更多的知识。

5OpenCV开源算法库在各个领域的实例化体现

OpenCV在医学领域、军事领域、安全防护领域等都有很大的重要意义。在医学领域中，由于有了这个开源算法库，我们可以尽可能地调用它，从而来进行图像处理、对象检测，让医生更好更快速观测人体结构，及时发现病症。在军事领域中，大多数无人操作的机器运作，比如无人机飞行、水下无人驾驶仪、无人驾驶汽车等等，都需要用到OpenCV来对图像进行处理，并进行分析，并且可以检测出人眼看不到的事物，这是OpenCV能够带来人类的巨大的进步。在安全防护领域中，我们现实生活中常见的汽车的安全驾驶，房屋入侵的检测、自动监视报警系统等等,正是由于这些技术，让我们的环境更加安全，这都是我们生活中息息相关不可缺少的。现如今，国家的科学技术飞速发展，日益强盛，OpenCV的成绩有目共睹，未来的发展需要科学技术的不断推进，才能为祖国未来的其他事业提供强有力的后盾。

6OpenCV在科学教育中的作用

在文化改革的大背景下，文盲的概念早已从没有文化转变成了不会使用计算机。因为随着科技的进步，计算机的使用已经越来越广泛，计算机已经逐步取代了以往人工可以完成的许多工作，比如在超市生成的结账单、用计算机控制动力系统的运行、人造卫星轨迹的计算等等，这些都依赖于计算机强大的功能。计算机的推广证明着我国科技的发展和人类文明的进步，由此可见，计算机技术知识的掌握对现代人来说是十分重要的。如果想要成为一个真正有技术、有能力的人才，就务必要熟练掌握计算机技术的使用。但是目前当代社会的教育在计算机技术方面的内容还不够丰富。减压政策开放以来，教育课时被压缩，技术知识的传输也相应减少，学生们的能力也因此日益下降。而科学教育，顾名思义，是使科学技术在教育过程中得以传承。想要科学地教育学生，就必须要多多讲授科学技术方面有关的知识。说到科学技术，它的重点自然是计算机技术，而OpenCV作为计算机视觉技术的核心，可以说也是计算机技术甚至科学教育中的一个重要部分。在教育中普及并传承这个技术无疑可以提高学生们的技术水平。但是，相信有大多数的人在此之前从未听说过计算机视觉技术，也并不了解OpenCV库，更加不会学习到与之有关的技术知识。在这样严峻的形势下，我们更应该将类似OpenCV方面技术有关的知识通过教育传递下去。各大高校应积极开展有关计算机的活动，开设与计算机技术有关的课程。这样才能根据社会的需求来培养更多的综合性人才。如果可以将其投入到现代教育当中，定会使现在的教育事业更加辉煌，也能使祖国的未来更加璀璨。

参考文献

[1]于仕琪,刘瑞祯.学习OpenCV(中文版)[M].北京:清华大学出版社,2009.

[2]阴法名.基于OpenCV图像处理[J].科技信息,2009(32):220.

[3]贾小军,喻擎苍.基于开源计算机视觉库OpenCV的图像处理[J].计算机应用与软件,2008,25(4):276-278.

[4]陈胜勇.基于OpenCV的计算机视觉技术实现[M].北京:科学出版社,2008.

[5]刘洁,冯贵玉,张汗灵.一种图像处理和计算机视觉的开发工具[J].计算机仿真,2006(11).

计算机视觉识别技术范文

关键词：智能视频监控；目标跟踪；运动分割；图像标定

中图分类号：TP311文献标识码：A文章编号：1009-3044（2012）35-8499-03

1概述

在人类的活动所涉及的各种信息中，以视觉信息所占是比重最大。人类主要依靠视觉系统来形成记忆。计算机视觉系统便是模拟人类视觉系统的某些功能，用摄像机和电脑代替人眼对目标进行识别、跟踪、测量，实现计算机对三维景物世界的理解。计算机视觉是计算机科学和人工智能的一个分支，目前既是工程领域也是科学领域里一个极富有挑战性的研究项目，它的实现，将给相关重要应用领域，如制造业、医疗诊断、检验以及军事领域中的智能、自主系统等，带来质的改变。近三十年来，计算机视觉技术已经取得了突飞猛进的进展，它的巨大应用前景将使得这种发展势头继续保持相当长的时期。

计算机视觉是通过运用各种成像系统代替人的视觉器官实现成像输入的，再由计算机来代替大脑完成对视频图像的分析和处理。目前有两种技术途径可以实现计算机的智能视觉效果，一个是仿生学方法，另一个是工程方法。仿生学是从分析人类视觉入手，通过对人类视觉成因原理的了解，参考人类视觉建立一个计算模型，用计算机系统将所有的过程和结果一一重现。由于这种技术方法目前还有许多难题需要破解，进展十分缓慢，因此更多的考虑采用工程方法。工程方法脱离了人类视觉系统的种种条框，从另一个角度寻找各种可行的技术方法实现计算机的视觉功能。

对于人类来讲，视觉系统虽然是获取信息的途径中占比最大的，但是，其他获取信息的通道也是必不可少的。在人类的智能系统中，感知行为是通过各个通道分别获取信息，然后汇集起来，使人类获得一个全面的感知。每个通道所获取的信息对于事物的理解或许是不全面的，但是，将所有的信息通道所获取的信息进行总和后却是可以得到一个相对完整的认识的。以前所研究的比较初级的人工智能系统就犯了以偏概全的毛病，希望通过独立运行一个完美的功能子系统就能获取所有的信息。为了达到这样一个目的，不得不去人为施加种种约束条件，或者造一些脱离实际的理想数据，结果可想而知。我们在研究计算机视觉系统的可行性方法的时候，也要认识到计算机视觉只是人工智能的一部分，它的功能是不能够孤立实现的，必须结合不同的应用背景，与不同的感知通道相互配合，综合达到智能视觉监控系统的目的。例如，计算机视觉系统运用在通信中，应与语言通道想配合；在发现和跟踪目标的应用中就要注意和激光和超声波等非视觉技术配合等。目前，关于计算机视觉的理论还不是太完善，但是相关的应用已经先行一步，该文对计算机视觉系统方面的实际运用方面进行了研究。

2计算机智能视频健康概述

2.1计算机智能视频监控研究现状

计算机视频监控是通过计算机视觉和图像处理来完成对目标的一系列监控目的，比如运动检测、运动目标跟踪、目标分类以及目标行为的描述与理解等。将这些监控目的进一步划分，其中运动目标的类与跟踪、运动检测是近年来视频监控领域里研究较多的项目，也是属于视觉处理中低级和中级的部分；而高级部分是行为的描述和理解，这也是业内近年来较多受到关注的研究热点，它代表了监控行业未来的发展方向，也是信息产业的未来发展趋势。由于它巨大的应用前景，产业界、学术界和各级管理部门都对它给予了高度重视，其中蕴藏着的巨大商机和所带来的经济效益更为人们津津乐道。

人们可以运用计算机智能视频监控系统对拍录到的图像序列进行自动分析，它特有的计算机视觉和视频分析技术可以自动完成这个过程，不需要人为进行过多干预。这样，就可以在很大程度上解决“他们正在做什么”、“他们将会做什么”的问题，而后，人们通过进一步的决策推理过程对“我们可以采取什么问题”的疑问给出答案。目前，社会上发起的平安城市等大型项目已经给智能视觉系统的应用提供了可供借鉴的方向，同时，还可以扩展到人流量统计、监控偷油行为、入侵行为等，这些需要用到智能识别系统的项目都使得人们逐渐对计算机智能视频监控系统重视起来。

2.2计算机智能视频监控系统与运动目标检测技术

目标的运动检测是一项相当困难的工作，这是因为背景图像中往往还存在一些动态变化的影响，如影子、光照、遮挡、混乱干扰以及天气等。这些因素的干扰使得人们很难将运动变化的区域从背景图像中提取出来。直接影响了对目标的分类、跟踪和行为理解等后期处理。目前，常用了运动目标检测技术有背景减除、时间差分、Rosenblum等。

2.3计算机智能视频监控与运动目标跟踪技术

2.3.1运动分割

动态环境中捕捉到的运动目标图像大多受到各种不确定因素的影响，如影子、物体之间或者与环境之间的遮挡、摄像机的运动、光照条件的变化等，这些都给准确有效的运动分割带来困难。但是，快速准确的运动分割是一个相当重要的环节。就拿影子的干扰来说，若是影子与与检测目标分离，容易引起误会，将影子误认为是场景中的目标；若是影子与目标相连，则会扭曲了目标的形状，使得基于形状的目标识别方法不再可靠。目前主要采用的是背景减除法，这种方法的适用范围有限。人们目前还没有找到对于任何复杂环境中的动态变化均有适应性的处理模型。研究者们试着运用时空统计的方法构建自适应的背景模型，也许对于那些不受限于环境的运动分割而言是个好方法。

2.3.2目标跟踪的分类

2.3.2.1根据目标跟踪与目标检测的时间关系可分为三类

一是先检测后跟踪，而是先跟踪后检测，三是边检测边跟踪。

2.3.2.2根据目标跟踪的所采取的策略来分，有3D和2D两种

3D的方法是在一个由基于坐标系构筑的三维立体世界内进目标进行跟踪，2D则是在一个二维平面内对目标进行锁定跟踪。2D的方法所需处理的数据较少，跟踪操作速度较快，但是，对于遮挡问题无能为力。

2.3.3跟踪方法细分

2.3.3.1基于特征的跟踪方法

不管是刚体运动还是非刚体运动，在一序列图像中，相邻的两帧图像中，由于采样时间间隔十分短，在视觉上差别微小，可以认为是这些个体特征在形式上具有平滑性。

2.3.3.2基于主动轮廓的跟踪方法

用参数表示轮廓线，运用目标的边缘特征提供运动方式、物体形状之外的其他目标信息。

2.3.3.3基于运动估计的跟踪方法

运用运动估计技术对目标进行分割和跟踪是一种常用的做法。

2.4图像标定

由目标在图像坐标系下的坐标来求得在世界坐标系下的坐标，称之为图像标定。通常是根据摄像机的内外参数来实现的，简称为摄像机标定。这种方法中，需要注意的是摄像机所得到的图像投影容易受到几何形变的影响，这样在建模的时候，导致精度不够。像平面与所拍摄的物平面上的两条平行线，在图像上就可能是两条相交的直线。一个匀速运动人，想要在图像坐标系下计算出其速度。但是，在近距离拍摄时，测得的速度快，远距离拍摄的时候，测出的速度慢。在进行目标跟踪之前，对目标进行良好的图像标定，可以使目标的动态特性建模效果更加精确。

2.5计算机智能视频监控技术难点

数字化、智能化是视频监控系统的未来发展趋势。目前，视频监控系统系统智能化还需面对许多问题，这些问题大多源于计算机视觉技术方面。

2.5.1从实际情况来看

视频监控系统需要面对一个十分复杂且不断变化的应用环境，这给计算机视觉技术的应用带来了更高的要求，要求能够自动、连续地工作，才能将目标从复杂环境下的分离、结构出来，从而进一步完成其他分析工作。

2.5.2其次，运动目标本身具有多样性的特征

如何使这些目标摆脱客观环境的限制，将目标的变化区域从背景图像中提取出来，从而目标进行运动分析、分类，尤其是对非刚性目标运动进行跟踪、行为理解还是相当困难的，这也是智能视频监控系统领域里近年来研究的重点。

2.5.3若是监控的范围扩大，就需要大量的摄像机进行协同工作

但是，实现多台摄像机对运动目标连续、一致的视觉分析还非容易之事。

2.5.4目前该领域内还产生了建立视频数据库的想法

系统通过这样的方法实现海量视频信息的存储、检索和查询，这方面也是近年来研究的热点，目前还处于起步阶段。距离视频监控系统的智能化目标还有相当长的路要走。

2.6计算机智能视频监控应用前景展望

2.6.1人数统计

在许多人流量大的地方都有人流量统计的需求，如火车站、广场等。这时候目标以人头为基本计算单位，对人头的检测和跟踪是主要技术要求。实际上这种检测轮廓非常重要。

2.6.2车流量统计

在许多路口，交通部门对车流量也需要有个大概统计，许多地方的车流量可以通过其他检测手段检测，视频图像是最快和较为准确的一种方式。

2.6.3遗留物检测

自911事件发生以来，全球对于公共安全的意识日益重视，各国纷纷采取多种措施防范恐怖主义袭击，例如加强出入口管制、随身行李检查、增加警备人员数目、追踪可疑人士的行径等。其中，监控系统扮演了非常重要的角色，特别是在车站、机场、大型商场等人口密集的地区，一旦发生炸弹引爆等恶意袭击事件，后果不堪设想。为了及早防范，监控系统需要采用具备遗留物侦测的智能分析系统，对可疑滞留物品实行及时通报和处理。另外，遗留物侦测也可以用来解决自动提款机（ATM）的安全问题。部份不法份子会在ATM加设卡片阅读机或贴上误导性信息，达到骗取钱财的目的，设置遗留物侦测系统可以及时发现这些非法架设的物品。遗留物侦测还可以用于侦测遗规泊车的情形，结合车牌辨识系统更可达到全自动的智能化执法。一旦发现禁止停车区域有车辆停留，便会触发遗留物警报讯号，并启动车牌辨识器记录违规停泊车辆的车牌号码，大大降低交通执法人员的工作量和运作成本。

2.6.4遗失物检测

在博物馆或公共展览厅贵重物品失窃的情形时有发生，单纯依靠录像做事后处理的消极性做法往往不能解决问题，如果在物品遭窃的瞬间就能马上发现对于防范事件有相当重要的作用。遗失物侦测的作用是可以侦测到画面上物品被移走或是偷走的情形，及时发出警报，同时也能自动分辨出对象属于遗留物还是遗失物。但这类检测对同色物体的分辨分析运算能力有很高的要求，同时对硬件的配套布置也有很严格的要求。

当摄影机被移动或是画面被遮蔽时会造成场景变化，侦测器便可以根据这种情况判断摄影机异常并发出警报。这种应用更加广泛。通产的移动检测都属于此范畴。

在实际应用场景中，日光对监控的影响较大，一般要避免逆光。

3结束语

综上所述，目标跟踪有非常广泛的应用市场需求，我国还处于起步阶段，研发出具有自主知识产权的、稳定可靠、技术先进、节约成本等特点的智能监控系统，可以有效填补国内空白。随着技术的成熟，硬件的推陈出新，应用产品的大幅降价，使得应用范围不断扩大，将来这方面会有更好的前景，使之成为一个能带动相关产业集体发展的一个新型产业。

3.1对经济发展的作用

良好的市场前景会促进企业在该产业的科技力量投入，有力促进了智能监控技术革新，使得企业进入了经济发展的快车道，同时带动了电子产业及相关企业的技术革新及经济发展。形成技术革新与资金的一个良性循环。

3.2对社会发展的作用

增加了对地方经济和就业需求的拉动。产业链的形成，强化实施企业之间的横向经济联合和技术协作，通过企业间技术平台上的横向协作，在特色产业基地内形成合力，打造一条新型的产业链。

3.3对人才培养推动作用

企业的相关类技术人员之间不断的合作交流，大大提高了企业相关类技术人才一个质的飞跃。达到技术推介和人才培养的目的，为国内，特别是经济发达地区今后在电子科研技术领域的进一步发展奠定人才技术的基础。

参考文献：

计算机视觉识别技术范文篇9

以人为中心的交互

传统方式下，计算机通过多种设定的程序与人交互，需要人去主动适应计算机。在新的交互模式中，计算机则能根据人的动作来主动适应人的要求，例如通过分析语音来识别人发出的命令，并通过语音合成来表达信息。

如何让计算机“看”，属于计算机视觉研究的范畴，已开始应用于实际的身份认证技术，例如虹膜识别、人脸识别等技术，通过采集的图像来获得信息并得出结果。现有的技术可以通过摄像机拍摄人的面部表情，然后利用图像分析和识别技术进行表情识别。能把图像“看进去”早已不是问题，一个小小的摄像头就能胜任，关键是如何从图像中获取所需的信息。要让计算机像人一样的“看”，最根本的问题在于计算机对图像的最终分析和理解，尽管图片中的形状、颜色、纹理已经为计算机提供了较多的信息，但是要能用先验知识去思考、识别，就又回到了人工智能这个老问题。

2002年伦敦帝国学院的科研小组花费数年时间来研究人类眼睛活动与大脑感知之间的关系，最终发明出一种专门用来捕捉眼球细微动作的红外线感应装置，被他们称为“眼标”。它能鉴别眼睛在显示屏上的移动和注视，如果电脑使用者盯住屏幕上的某个链接图标1秒以上，电脑就自动打开该链接；如果使用者盯住打印或者存盘的图标，电脑就会自动进行相应的操作（附图）

中科院自动化所研制成功的通过脸部动作来控制的智能轮椅，能够让使用者利用头部姿态控制其转动，即当人的头转向左边，轮椅左转；人的头转向右边，轮椅右转。这实际上是适时脸部跟踪和头位估计的问题。

随着传感器技术的发展，越来越精确的交互方式成为可能，例如用于识别手势的数据手套。它能对较为复杂的手的动作进行检测，包括手的位置和方向、手指弯曲度，并根据这些信息对手势进行分类。类似的，SimGraphics于1994年开发的虚拟演员系统，通过用户戴上的安装有触及脸不同部位的传感器的头盔，来控制计算机生成表情图像。

人机交互追求全方位

虽然语音、表情、姿态等均能独立表示一定的含义，并在某些场合完成交互过程，但人在交互过程中却总是通过各种信息的同时处理来进行的。实现多通道的人机界面是人与计算机最为自然的交互方式，它集自然语言、语音、手语、人脸、唇读、头势、体势等多通道为一体的,并对这些通道信息进行编码、压缩、集成和融合，集中处理包括图像、音频、视频、文本等多媒体信息。目前，多模态技术正在成为智能人机交互的研究热点。

“模糊”理解人的情感

精确交互技术能用一种技术来完全达到用户的交互目的，例如键盘和鼠标器均需用户精确输入。而人们的动作或思想往往并不很精确，计算机应该理解人的要求，甚至纠正人的错误，智能化的交互界面就是为了实现这样的目标。与此同时，新一代的人机交互过程能够处理复杂的情感信息，这就是所谓的情感计算。

人的情绪与心境状态的变化总是伴随着某些生理特征或行为特征的起伏，人们表达情感通过一系列的面部表情、肢体动作和语音来进行，又通过视觉、听觉、触觉来感知情感的变化。视觉察觉则主要通过面部表情、姿态来进行。语音、音乐则是主要的听觉途径。触觉模型则包括对、冲击、汗液分泌、心跳等的处理。

情感计算研究的重点就在于通过各种传感器获取由人的情感所引起的生理及行为特征信号，建立“情感模型”，从而创建一个能感知、识别和理解人类情感的能力，并能针对用户的情感做出智能、灵敏、友好反应的个人计算系统，缩短人机之间的距离，营造真正和谐的人机环境。目前为止，有关研究已经在人脸表情、姿态分析、语音的情感识别和表达方面获得了一定的进展。

无处不在的计算

由于新一代高速互联网的飞速发展，网络带宽和CPU计算能力的成倍增长，以及多媒体技术的日益成熟，计算机、通信及多媒体技术逐步趋向融合。以互联网为基础的信息基础设施，将成为人与人之间交互或人与信息源、外部世界交互的媒介。在这种环境下，计算将无处不在。

无处不在的计算最早是由已故的XeroxParc计算机科学实验室主任MarkWeiser和他的研究小组在20世纪90年代初构想并提出的。Mark认为，从长远看，个人计算机和工作站会消失，因为计算会变得无处不在，这种消失并不是技术发展的直接后果，而是人类心理的作用。当人类对某些事物掌握得足够好的时候，这些事物就会成为生活中不可分割的一部分，人们就会慢慢地忽略其存在。今后，许多计算装置也会变得就像DonNorman描述的那样变成了不可见的计算机，计算也会变成无处不在，不可见的人机交互也会无处不在的。就像我们时刻呼吸着的氧气一样，我们看不见却可以体验到。

受到无处不在的计算以及穿戴式计算机和虚拟现实发展的影响，MITMediaLab的H.Lshii等人对早期的GUI(GraspableUserInterface，可抓握用户界面)理论进行了重要发展，于1997年提出有形用户界面的思想。传统的图形用户界面事实上成为隔离物质世界和信息世界之间的屏障，而有形用户界面希望在用户、比特和原子之间建立一个无缝交互界面。

信息内容的智能处理

人和计算机的交互一方面是为了获得服务，另一方面则需要通过计算机处理大量的信息。因此，智能人机交互的另一个重要范畴就是实现信息内容的智能处理。

信息技术产品逐步进入后PC时代,各式各样的信息家电、网络接入终端以及集成计算与通信功能的产品繁多。易用性、善解人意已逐渐变成信息设备参与市场竞争的关键。甚至一个具有重大创新的知识产权将带动一个新产业。如中文和汉语信息处理，面向信息内容的智能化处理技术，包括文字与语音的识别、翻译、查询、分类、摘要等。这方面的技术突破将极大地推动信息服务业和计算机产业。

将信息转变为知识、将信息基础设施发展为知识基础设施是21世纪的重要技术发展方向。其中，软件技术将在数据发掘、知识发现、Internet海量信息的智能化检索和网上软件机器人等方面进行重点突破。

传统与智能交互并存

新一代的智能人机交互，力图淡化传统的计算机数值计算的概念，突出以人为本的交互过程。那么传统的以键盘、鼠标和屏幕为基础的GUI交互界面是否马上就会消失呢？

美国著名的计算机图形学家A.VanDam认为：“虽然各种三维图形的应用发展得很快，如虚拟现实、科学计算可视化等，但GUI、3DWidget等都将长期存在”。这是因为目前大量的应用已经采用成熟的GUI技术，因此GUI不会被淘汰。

国内外研究状况

计算机视觉识别技术范文

关键词：手势识别；发展现状；技术应用；关键技术

一、人工智能手势识别人机交互技术的相关概述

手势识别是计算机科学和语言技术中的一个主题，目的是通过数学算法来识别人类手势。本领域中的当前焦点是动态和静态的手势识别。在人机交互方面，用户可以使用简单的手势来控制或与设备交互，从而避免接触。除此之外，姿势、步态和人类行为的识别也是手势识别技术的主题。手势识别可以被视为计算机理解人体语言的方式，从而在机器和人之间搭建起更方便的桥梁。

手势识别最初是使用机器设备，有线地连接在计算机系统上，从而直接检测手胳膊各关节的角度和空间位置并将这些手势数据完整无误地传送至识别系统中。其典型设备如数据手套等。其后，通过对传感器技术的发展，光学标记方法取代了数据手套，用户只需佩戴光学标记设备，便可通过红外线将人手位置和手指的变化传送到系统屏幕上。光学标记方法也可提供较好的识别效果，但仍需较为复杂的设备。

外部设备的介入虽使得手势识别的准确度和稳定性得以提高，但却掩盖了手势自然的表达方式。为此，基于视觉的手势识别方式应运而生，视觉手势识别是指对视频采集设备拍摄到的包含手势的图像序列，通过计算机视觉技术进行处理，进而对手势加以识别。

二、人工智能手势识别人机交互技术的发展现状

（一）国外发展现状

手势识别技术已经在全球范围内被广泛研究与应用。韩国的高校研究员设计的手势识别系统平均识别率超过60%；印度研究者在视觉手势识别的基础上，提出了一种基于结构特征的手势识别算法，使得识别率大幅度改进；除此之外，许多大型跨国电子企业也投入到手势识别的研究与项目开发中，如三星开发出了智能电视，可通过手势与语音完成开关机、换台、音量调节等操作；微软研发了一种通过笔记本电脑内置的麦克风和扬声器实现手势识别的技术等。

（二）国内发展现状

近年来，我国对基于手势识别技术的人机交互的研究得到了极大的发展，高校研究所与科研单位贡献了许多研究成果。中国科学院软件研究所通过建立模型，实现了对人手运动的鲁棒性跟踪，即跟踪丢失后可自动恢复，继续跟踪；中国科学技术大学和哈尔滨工业大学合作研究出了基于“大小手”的徒手手势实时识别，该系统对常用手势识别率极高；清华大学计算机科学与技术系提出了一种新的基于表观的手势识别技术，实现了对12种手势在线识别的系统，并拥有极高的准确度。

三、人工智能手势识别人机交互技术的应用方向

（一）在工业控制领域的应用

在工业控制领域中，手势识别技术可用于无接触梯控，减少可能存在的接触以防止病毒的传播。如在电梯中加装摄像头和显示屏，通过对手势的识别来操控电梯楼层、开关门，可以极大地减少不必要的接触，在新冠病毒威胁尚未消除的当下，这项应用具有相当大的价值。除此之外，手势识别还可以用于操纵工业机器手，完成某些具有风险但精度要求并不高的工作，如操作链锯、浇筑铁浆等，极大地保障了工人的生命安全。

（二）在医疗设备领域的应用

手势识别与智能化医疗相辅相成，能极大地减轻医生、护士的负担，为病患提供更好地服务。汇春科技公司研制了隔空手势识别芯片，加载在医疗设备上之后，可以实现隔空手势感应与应用护理，无论是护工的日常清理还是护士的护理上药，均可通过该芯片操纵设备隔空进行，极大地减少了病菌的传播，进一步保护了病患和医护人员的生命安全。

（三）在智能家居领域中的应用

手势识别技术可以与日常家电结合，在之只能家居领域大放异彩。以电视为例，加载了手势识别技术后，智能电视可实现远距离通过手势切换频道，调节音量，甚至用手势实现开关电视，极大地方便了人们的生活。

四、人工智能手势识别人机交互技术的应用发展策略

（一）不断完善技术产业链

对人工智能手势识别的后期发展中，可以通过科研机构、各高校对人工智能手势识别的应用方向进行有效创新研究，将理论研究，产品设计，工艺制造、测试使用形成一条产业链，大力推动手势识别技术的应用和发展。

（二）积极发展核心关键技术

手势识别技术的某些瓶颈难题，如识别成功率受到周遭环境影响极大，手部关节因人而异，不同用户做手势时存在的熟练度和速率差异，效率和识别延迟等问题，均需要通过发展核心关键技术来克服，把控和发展核心关键技术将是手势识别技术大力发展的保证。

结束语

对人工智能手势识别人机交互相关技术进行全方位多层地的分析与探讨后发现，我国的很多领域均出现了手势识别技术的应用实例，部分获得了较好的成果。但需要注意的是，综合各个行业的应用实例来看，应用场景存在极大的差异，整体技术层次参差不齐，同时各大高校研究机构对于该技术的研究方向均不尽相同，这说明手势识别技术还存在着相当大的潜力待人们发掘。

参考文献

[1]陈壮炼，林晓乐，王家伟，李超.基于卷积神经网络的手势识别人机交互系统的设计[J].现代计算机，2022(06):57-62.

[2]任海兵，祝远新，徐光，林学，张哓平.基于视觉手势识别的研究—综述[J].电子学报，2000(02):118-121.[3]孙超，冯志全，李扬，张明敏，张文杰，潘志庚.基于手势识别的人机交互综述[A].中国计算机学会多媒体技术专业委员会、中国图象图形学学会多媒体专业委员会、中国计算机学会普适计算专业委员会、ACMSIGCHI中国分会、中国自动化学会.第六届和谐人机环境联合学术会议（HHME2010)、第19届全国多媒体学术会议（NCMT2010）、第6届全国人机交互学术会议（CHCI2010）、第5届全国普适计算学术会议（PCC2010）论文集[C].中国计算机学会多媒体技术专业委员会、中国图象图形学学会多媒体专业委员会、中国计算机学会普适计算专业委员会、ACMSIGCHI中国分会、中国自动化学会:中国计算机学会多媒体技术专业委员会，2010:9.

[4]李清水，方志刚，沈模卫，陈育伟.手势识别技术及其在人机交互中的应用[J].人类工效学，2002(01):27-29+33.

[5]任雅祥.基于手势识别的人机交互发展研究[J].计算机工程与设计，2006(07):1201-1204.

[6]杨益平，闵啸.基于计算机视觉的手势识别人机交互技术[J].电子技术与软件工程，2018(12):138-139.

[7]顾立忠.基于表观的手势识别及人机交互研究[D].上海交通大学，2008.

计算机视觉识别技术范文篇11

关键词广告设计;计算机;多媒体

中图分类号TP3文献标识码A文章编号1673-9671-(2010)042-0034-01

广告设计在当今经济全球化、信息社会化、产业知识化大趋势下,将自然科学与人文社会科学相互渗透和融合,特别是与计算机技本进行整合创新,给业界注入了新的活力,带来了革命性的变化。因此,广告设计与计算机技术融合,是一个具有深远意义的课题。

1广告设计在整合中创新发展

整合是从生理学引进的一个概念,它是指有机体中各组成要素通过相互协调、融合、互补而组成完整系统的过程,具有缝合、综合、融合、一体化等含义。广告设计由手绘到使用计算视技术是作为整合的整体进行创新发展。

广告活动一般有五个环节:广告调查、广告策划与创意、广告设计、广告媒体和广告效果测评。在活动的科学性和逻辑性上,每一个环节都在为下一个环节做准备,一环扣一环。而广告设计只在这一特定的环节上起作用,也就是说,广告设计所要表达的内容,是由前面的环节提供基础和框架的,其内容(即信息)表达得不充分不行,表达得过分或产生歧义也不行,没有创新性更不行。前面两个环节为设计提供的基础与框架,主要内容包括市场信息、消费心理、产品竞争优势、同类产品情况,以及总体宣传意图和基本创意等等。在此基础上,广告设计应为总体的促销目的服务,要求在视觉上富有感染力,准确的、巧妙的、全面的表达广告宣传意图。首先,它是将一个广告宣传意图外化为某种视觉样式的创造,为广告信息传播服务的,而不是设计人员的神来之笔。其次,它是将特定的广告主题,通过富有艺术魅力的视觉形象,使人们信服地接受宣传。总之,广告设计从各个层面、各个角度,以各种手法吸引大众的视线,艺术化地将资讯传达给受众,并力求以艺术化的个性表现和强烈的视觉冲击力,赢得受众的视觉好感和心理认同。广告设计作品中的影像、图形、文字、色彩、声音等“符号”都在“劝说”人们努力改变思维的定势和惯常的生活方式,积极接触新事物、新观念,最终达成一种持久的可信度。

广告设计和建筑设计、工程设计、服装设计、美术设计、装潢设计一样大量借助计算机技术,特别是多媒体技术将广告音乐电视(MTV)化,其信息形态、信息结构和视觉风格较传统电视广告呈现明显创新:①从信息形态看,MTV化广告很少使用语言图像,歌曲或音乐信息取代了语言信息的重要地位;②从信息结构看,MTV化广告不再向受众清晰地表述与商品有关的事件和事项,强调的是不同时空的场景和画面,且跳跃幅度很大,受众只需惬意地去感受场景和事件的碎片;③从广告风格看,MTV化广告画面切换快速频繁。传统电视广告一般平均2秒左右切换一次画面,而MTV化广告平均l―l.2秒左右切换一次,快速切换、闪现的画面具有强大的视觉冲击力,满足了现代人视觉感官的。又如影视广告,影视广告的长度通常是30秒和15秒,在如此短暂的时间里面,只有采用实拍素材精确剪辑,结合计算机动画的特技效果,加上方便快捷的字幕软件和电子配音合成,才使影视广告具有了前所未有的视听表现力和震撼力。广告设计借助计算机技术创新发展已成为不争的事实。

2计算机技术在整合中拓展领域

计算机技术最初是与工业设计相整合,CAD概念是20世纪60年代在美国麻省理工学院提出的,当时人们希望通过一定的界面与计算机共同工作,在完成操作的过程中,人与计算机互为补充,由于硬件条件和软件条件不完善,计算机辅助设计比较幼稚,效果并不理想。上世纪80年代人们开始重新定义计算机图形图像技术发展的方向,为设计工作者开发了新的软件。特别是集成电路技术、计算机技术、码率压缩技术的快速发展,将数字电视技术、计算机技术和数字通信技术相结合,产生了多媒体技术,从此传统设计被注入了新的活力。它的积极效应主要在于:①计算机多媒体作为一种新的资讯载体,它集图形、视频、声音、动画于一体,具有直观性强、容量大、操作简单等优点,使人机交互变为现实,增强了广告的互动功能,其用途十分广泛而且成本低廉。它还具有独特的优势:生动活泼,表现性强、操作简单、交互功能和通用性好。②极大地拓展了多媒体应用领域,使计算机设计软件由过去单一图形发展成能适应网络、动画、视频、音频等各种广告需求的软件,成为广告设计不可或缺的重要工具。如常用的广告设计软件有:Photoshop、CordDraw、PageMaker、3DMax、Flash等。③计算机技术与广告设计的整合促使广告形式有了长足发展。

3整合后的计算机广告设计发展空间更大

所谓广告设计与计算机技术的整合,就是两者通过有机地结合,将计算机技术与广告设计融为一体,使计算机技术作为一种工具来共同完成设计任务。大家知道,计算机技术包括编程、建模等等,属于计算机专业的范畴。计算机广告设计,是指运用计算机多媒体技术创作设计广告,这些广告包含平面广告、电视广告、网络广告、户外广告等多种广告形式。换句话说,计算机广告是指利用计算机多媒体技术将广告中所需要的文本、图形、图像、动画、音频、视频等多媒体信息按照一定的广告策略、广告创意进行数字化采集、制作、处理、压缩、存储与应用等加工处理而成的广告表现。计算机广告具有丰富的信息资源、友好的交互环境、图文并茂的显示功能等特点。

计算机广告设计还在其他广告形式上表现突出,如CI设计。计算机CI设计是将现存的工作实践和技能自动化。当二维制图和三维建模从手工向电子的方式转换时,它采用了许多传统的制图惯例,除了下拉菜单,共享数据库等新的概念,它的优点还在于:一旦产品信息转化成数字形式,就可应用到许多不同的领域来传播统一和独特的企业形象。换言之,它能最经济地把企业抽象的理念形象化,智能地运用标准色、标准字、标志、图案等视觉语言,通过有效的传播媒体介绍企业,争取社会公众的认同,达到树立企业形象的目的。计算机广告设计的发展不仅是技术性的,更是富于革命性的工作方式的转变。

计算机视觉识别技术范文1篇12

关键词智能交通系统；计算机视觉；汽车流量

中图分类号：TN948文献标识码：A文章编号：1671-7597（2014）14-0048-01

基于视觉的图像处理器测量精度高，抗干扰能力强，许多自然及人为的干扰都可以被消除，运用预测技术可以再捕获瞬间丢失的目标，并且能实现对记忆的跟踪。它通常安装在路边或架空安装，不会重新铺设路面，也不会影响埋在地下的水和天然气管道，更不会干扰交通。基于视觉的图像处理有其突出的优点，表现在：可以获得的目标信息非常巨大，获取信息的方法也非常方便。

1研究的实用意义

车辆检测系统在智能交通系统中具有很重要的地位。机动车辆流量计数与监控为智能控制提供了相当重要的数据来源，通过计算机视觉的机动车流量统计系统可以检测很多交通参数，便于我们检测和监控，这些参数中的一个重要参数就是汽车

流量。

基于视频的检测法作为最有前途的方法之一，有以下优点。

1）能高效、准确、安全可靠地的监视和控制道路交通，能够提供高质量高分辨率的图像信息。

2）用于交通监视和控制的主要设备就是安装视频摄像机，现在我国所有城市基本都已经安装了视频摄像机，甚至高清视频摄像机。因为安装视频摄像机破坏性非常低、很方便、也很经济。

3）由计算机视觉得到的交通信息可以通过联网工作，非常有利于对道路交通网的监视以及控制。

4）由于目前对智能交通系统的安全性、实时性和可靠性的要求都非常高，计算机技术和图像处理技术的发展显得极其

重要。

2研究内容

本研究主要包含两大部份：一部分就是采用分类和分割方法把采集到的视频图像的目标进行识别；另一部分就是通过定位方法来实现目标的跟踪。这两部份是缺一不可，紧密联系在一起的。

首先先介绍视频图像的目标识别，视频图像目标的识别方法有很多，但总体上主要有两种方法：一是大家熟悉的相关匹配法，二是特征匹配法。相关匹配法是通过找到最大相关值（最大相关值指的就是当前图像与参考图像间的相关系数的大小）所在的位置来确定当前输入图像中的目标位置。相关匹配法优点是可以在信噪比很小的条件下工作，对噪声抑制能力非常强，在计算形式上比较简单，很容易实现。但它的缺点也很明显，由于相关匹配法对几何和灰度畸变十分敏感，反而计算量偏大，造成的直接后果就是非常容易产生累积误差，而且最关键的就是不能充分利用视频图像目标的几何特性，就不能保证对识别目标的跟踪精度。相关匹配法比较适合于对目标的尺寸变化不大并且场景各部分的相关性不强，当前输入图像和参考图像的产生条件较为一致的场合。特征匹配方法是目前研究较多的一类图像匹配方法，它是通过目标的特征与输入图像中目标的特征来比较辨识目标。它首先提取输入图像和参考图像的相关特征信息，比如边缘、角点等。然后通过测量距离来比较输入图像与参考图像的特征集合，如果输入图像的特征集与参考图像的特征集距离是最小的（在满足给定约束条件下），则判定该目标被识别。它对目标的几何特征、灰度畸变一点都不敏感，但它充分利用了目标图像的特征信息，因而可以保证较高的跟踪精度。

上面介绍了视频图像目标的识别，现在介绍本研究第二部分：通过定位方法来实现目标的跟踪。对于图像目标的跟踪方法通常有下面几个方法。

亮度中心法，其实这种方法计算很简单，只要确定了一个点，就能完成定位。这个点就是一个跟踪点，它就是具有最高灰度的像素点（来自获得的视频目标图像）或这个点上的一个邻域。这种方法、性能很稳定、容易实现，工程上运用的很多。但这种跟踪非常容易受干扰，因为它主要适用于红外和其他放射性目标的跟踪。

最佳空间滤波法是常用跟踪方法之一，它完全是在亮度中心法的基础上建立起来的，为了提高跟踪性能，就要把目标的大小、形状、运动特性等特征都完全利用起来。但目前这类方法也有明显缺点，在实用性、定位精度上和计算量方面都有较大的限制。

投影、形心法是通过目标的投影或形心来确定目标的实际位置和运动姿态。对比前面两种跟踪方法，投影、形心法的优点是计算量非常小，容易通过硬件方式来实现。缺点是它的抗干扰性能力比较差，主要用于均匀背景下跟踪孤立目标。

从以上对研究内容的介绍，现有的各类识别和定位方法都各有优缺点，要想找到一个合适的方法，都达不到满意的效果。要想取得较好的性能，都只能在目标尺寸相对对比度变化都不大、对噪声的干扰又比较小、图像灰度的空间变化并不明显的理论环境中。然而实际的环境通常是变化无常的，通过一种方法来实现目标的识别与跟踪很难有合适的效果。最近几年，结合这些方法的优点和缺点，混合定位识别的方法确能将上述各类基本的识别方法进行混合定位，使它们能够合二为一，相互补充。这代表着目标识别方法非常具有理论研究和应用价值，是一个重要发展方向。

3技术路线

研究的技术路线（如图1）：首先提取出摄像机采集到的视频，该视频是以帧为单位的图片文件形式。然后对图像数据进行数学上的处理，比如二值化、提取边缘等。这样就可以识别汽车的位置进行定位，最后对识别出来的汽车数量通过计数器计数。

4研究实现

通过基于计算机视觉的研究，我们设计出了能够实现机动车流量的检测和计数的系统。并且该系统能够对运动目标进行识别与跟踪定位，对出现多目标遮挡和丢失目标，还可以重新匹配。

5结束语

本文创新之处就是将上述各类基本的识别方法进行混合定位，使它们能够相互补充。这代表着目标识别方法非常具有理论研究和应用价值，是一个重要发展方向。

参考文献

[1]章毓晋.图像工程（第2版）[M].清华大学出版社，2007.

[2]夏文龙.基于计算机视觉的汽车流量检测研究[D].四川大学，2003.

[3]葛群辉，浅谈基于视觉的高速公路车流检测技术[J].科技资讯，2010（2）.

[4]刘萌萌，基于无标度摄像机的车流跟踪与速度估计算法研究[D].西南交通大学，2005.

计算机视觉识别技术范例(12篇)

计算机视觉识别技术范文篇1

计算机视觉识别技术范文篇2

计算机视觉识别技术范文篇3

计算机视觉识别技术范文篇4

计算机视觉识别技术范文篇5

计算机视觉识别技术范文1篇6

计算机视觉识别技术范文篇7

计算机视觉识别技术范文

计算机视觉识别技术范文篇9

计算机视觉识别技术范文

计算机视觉识别技术范文篇11

计算机视觉识别技术范文1篇12

年级写人的作文范例(整理5篇)

党员酒驾检讨书范例(精选3篇)

装配建筑市场分析范例(3篇)

装配工年度总结范例(3篇)

教师个人工作总结标准模板范文3篇

幼儿园教职工培训计划范文(精选5篇)