首页 智能视频算法评估综述

智能视频算法评估综述

智能视频算法评估综述第22卷第2期 2010年2月计算机辅助设计与图形学学报 JournalofComputer—AidedDesign&ComputerGraphics V01．22No．2 Feb．2010 智能视频算法评估综述李鹏飞1’∞，陈朝武1’∞，李晓峰h幻 l’(北京中盾安全技术开发公司技术部北京100048) 2’(中华人民共和国公安部第一研究所北京100048) (1ipengfei08@gmail．corn) 摘要；智能视频监控在公共安全和民用领域已经显现出有效与广阔的应用前景，备受国内外学者...

第22卷第2期 2010年2月计算机辅助设计与图形学学报 JournalofComputer—AidedDesign&ComputerGraphics V01．22No．2 Feb．2010 智能视频算法评估综述李鹏飞1’∞，陈朝武1’∞，李晓峰h幻 l’(北京中盾安全技术开发公司技术部北京100048) 2’(中华人民共和国公安部第一研究所北京100048) (1ipengfei08@gmail．corn) 摘要；智能视频监控在公共安全和民用领域已经显现出有效与广阔的应用前景，备受国内外学者和众多实际工程领域专家的高度关注，制定有效、公正的智能视频算法评估准则是其应用过程中的一个重要环节．文中对当前国际上智能视频算法的评估工作进行了比较全面的综述，重点是运动检测、目标跟踪的性能评估．最后指出了智能视频算法评估的发展方向．关键词：智能视频；运动检测；目标跟踪；性能评估；视频监控中圈法分类号：TP391 AnOverviewforPerformanceEvaluationofIntelligentVideoAlgorithms LiPengfeil，∞，ChenChaowul·∞，andLiXiaofeng㈨ 1’(R＆DDepartment，BeringZhongDunSecurityTechnologyDevelopmentCo．，Beijing100048) 2’(TheFirstResearchInstituteofMinistryofPublicSecurityofPeople’sRepublicofChina，BeOing100048) Abstract：Intelligentvideosurveillancehasbeendevelopedrapidlyandbroadlyindailypublicsecurity andvariouscivilapplications．Toestablishaneffectiveandstandardperformanceevaluation，an appropriatemetricisveryimportant．Thissurveysummarizesthestate-of-the—artofperformance evaluationforintelligentvideoalgorithms，especiallyfocusesontheperformanceevaluationofmotion detectionandobjecttracking．Italsohighlightsthefuturedirectionforperformanceevaluationof intelligentvideoalgorithms． Keywords：intelligentvideo；motiondetection；tracking；performanceevaluation；videosurveillance 现代社会是一个人口密集、高度复杂的社会，面临的突发事件和异常事件越来越多，对其监控的重要性与难度也越来越突出．为此，新一代的智能视频监控技术得到了世界各国政府和学者的密切关注．特别是在911恐怖袭击、马德里爆炸案以及伦敦爆炸案发生以后，市场上对此类应用的需求不断增长．与智能视频监控系统相比，传统的视频监控系统存在着以下缺点：由于人类自身生理上的弱点，监控者经常无法察觉安全威胁，从而导致漏报现象的发生；从监控时间来看，很难实现7×24的全天候监控；从响应速度来看，传统的监控系统通常都由安全工作人员对安全威胁事件做出响应和处理，很难做到实时的响应．为了解决这些问题，智能视频监控技术应运而生．智能视频监控源自计算机视觉技术．计算机视觉技术是人工智能研究的分支之一，它能够在图像及图像描述之间建立映射关系，使计算机能够通过数字图像处理和分析来理解视频画面中的内容．视频监控中所提到的智能视频技术主要是指自动分析和抽取视频源中的关键信息．智能视频技术借助计算机强大的数据处理能力对视频画面中的数据进行高速分析，过滤用户不关心的信息，发现监控画面中收穑日期：2009—03—04；修回日期：2009—07—02．基金项目：国家“十一五”科技支撑计划项目(2006BAK08806)．李■飞(1981一)。男，硕士，主要研究方向为图像处理、安全评估、安全防范；陈朝武(1956一)。女，硕士，研究员·主要研究方向为综合安全技术、信息系统集成、流媒体等；李晚蜂(1973一)，男，博士，副研究员，主要研究方向为网络与系统安全、安全评估、流媒体、安全防范．万方数据第2期李鹏飞，等：智能视频算法评估综述 353 的异常情况，并能够以最快和最佳的方式发出警报和提供有用信息，从而能够更加有效地协助安全人员处理危机、最大限度地降低误报和漏报现象．随着各种各样智能视频算法和系统的提出，判断这些系统实用性的评估方法变得至关重要，这不仅有助于算法本身的改进，同时可以帮助决定视频监控系统的适用场景以及智能视频设备生产厂商对算法的选择和终端用户对产品的选择．目前，国际上对于智能视频算法性能评估主要关注运动检测、目标跟踪等方面，本文将对这2个方面的评估进行总结． 1相关研究目前，国际上关于智能视频算法评估方面的研究很多，如CAVIAR①，VACE⑦，ETISEO③，CU：AR④， PETS⑤等．这些工作中，研究者提供了一系列手工标注GT(groundtruth)数据的视频序列，算法设计者可以在这些序列上对算法输出结果和GT数据进行比较，以评估相关算法的性能，评估过程如图1 所示．图1 智能视频算法评估流程图 CAVIAR项目从2002年10月1日持续到 2005年9月30日，其主要目的在于解决城市中心监控和商场的应用．它分析检测城市中心监控中一些不寻常的事件，如人的奔跑、聚集、静止等，然后可以通过报警通知安全中心的工作人员．而在商场，则分析潜在客户的行为，例如他们走过的路线、在某个特定的位置停留时间等，帮助商场对其布局做一个评估，并对其进行调整，以吸引更多的顾客． VACE项目开始于2000年．由于VACE提供的视频中包含了大量的会议视频、新闻广播视频，因此它更多地关注人脸检测／跟踪、文本检测／跟踪／识别、行人检测／跟踪／定位、手检测／跟踪、事件检测等任务．在VACE的第一阶段和第二阶段(2000一 2006年)，它在新闻广播、会议、监控这几类视频中，对人脸、手、人、车以及文本等运动目标的自动检测和跟踪方面取得了显著的进步．在VACE的第二阶段中，南佛罗里达大学(USF)和美国国家标准和技术协会(NIST)协作进行了评估方面的工作．目前 VACE已经进入了第三个阶段，它开始更多地关注算法处理的准确度、速度等方面的问题． ETISEO是从2005年到2006年12月由法国政府赞助的视频监控系统评估项目，它主要研究视频特征和算法之间的关系，其目的在于确定一个给定的算法所适用的场景特征，从而帮助算法设计人员来发现算法的不足之处，以利于以后的改进．针对运动目标的检测、跟踪任务，ETISEO提出了由一个主要度量结合一些补充的度量组成的评估方法，来衡量算法在这些任务上的综合表现；另外，它在目标的定位、分类，以及事件识别的算法评估方面也做了一些工作． CLEAR是由VACE和CHIL(computersinthe humaninteractionloop)@联合主办的工作组会议，主要关注人／车跟踪、人识别(语音)、头部姿态估计、有声场景分析等任务，其全称为Classificationof Events，ActivitiesandRelationships--Evaluation CampaignandWorkshop．目前，CLEAR已经召开了2次会议．跟踪和监视性能评估工作组会议(performance evaluationoftrackingandsurveillance，PETS)的主要目的是评估视觉中的跟踪和监控算法．第一次 PETS会议于2000年3月召开，截止2008年已经召开了10届．早期的PETS主要关注对人、车等运动目标的检测和跟踪，如今这些技术已经相对成熟，开始转而关注事件级别的检测，例如人的行为识别、行李遗弃检测等．PETS中提出了大量的以像素、目标为单位的统计评估方法．目前PETS已为运动目标检测这一任务提供了在线的评估服务．相对国外研究，国内在智能视频测试方面的工作几乎没有，因此本文的调研对象主要以国外的研究为主． 2运动检测评估运动检测是指由图像J弘列中将变化区域从背景图像中提取出来，它处于数字化智能视频监控系统的最底层，是目标分类、目标跟踪、行为理解等后续 http：，，l姗epages．inf．ed．a。uk／rtff／CAWAR／ httpd／www．icarda．org／InfoExploit／vace／index．html http：Ilwww-sop．inria．fdorion／ETISEOlindex．htm http=llwww．dear—evaluation．o吲 httplllw*w．pets2007．net／ http：／／chil．server．de．，万方数据 354 计算机辅助设计与图形学学报第22卷工作的基础．运动区域的有效分割将大大减少后续过程的运算量．所以建立一个合理的运动检测算法评估方法显得尤为重要和必要．由于运动检测可以理解为一个二元的分类问题，即前景／背景的分类问题，因此可以定义一组TP (truepositive)，FP(falsepositive)，FN(falsenegative) 和TN(truenegative)，如表1所示．TP，FP，FN和 TN的统计单位主要有目标和像素2种；相应的评估指标也就有目标和像素2种．表1丁P。FP，TN和FN定义 2．1像素级别的评估以像素为单位[1。4]的统计中，丁P表示检测到在 GT框内的前景像素数，FP表示检测到在GT框外的前景像素数，FN表示检测到在GT框内的背景像素数，TN表示检测到在GT框外的背景像素数，如图2所示，其中灰色框表示GT框，黑色框表示算法输出结果．霭2 TP．FP，FN秘TN定义通过组合TP，FP，FN和’rN这4组数据， PETS发表的论文 ‘卜2小61中提出了表2所示的一些指标来度量算法的效果．表2运动检测算法评估指标指标名称计算方法检测率(Detectionrate)TPI(TP+FN) 检测准确率(Precision)TPI(TP+FP) 漏检率(Falsenegativerate) FN／(TP+FN) 误检率(Falsealarmrate) FP／(卯+FP) 准确度(Aecumcy) ‘黑：‘TN+TP+ 背景检测率(Specificity)TN，(TN+FP) 背景漏检率(Falsepositiverate)FP／(TN+FP) 背景笆测尊确亨‘，eg“”TJv／(TN+FN) predictivevalue) 检测的比率，Precision反映了被检测的前景像素的检测准确度；Detectionrate与Falsenegativerate 的和为1，Precision与FAR(falsealarmrate)的和为1；Accuracy表示所有的像素被正确分类的比率， Specificity表示背景像素被正确分类的比率，False positiverate表示背景像素被错误分类的比率， Negativepredictivevalue表示被归为背景像素的分类准确度．另外，PETS提供了在线的评估准则①，它由4 个指标值Ⅲ组成，具体形式如下： 1)NR(negativeratemetric)．某一帧内的算法输出与GT之间像素单位的错误匹配，即 NR一÷(NRf。+NRfp)，一、7NR l、／fnh一瓦而， NR一盟垒．fp一瓶；其中，Nfn和Nfp分别表示漏检(FN)和误检(FP)像素个数，N。。和N。表示TN和TP数目，NR也即前景像素的漏检比率与背景像素的漏检比率的均值． 2)MP(misclassificationpenaltymetric)．使用目标比目标(object-by-object)的方法对算法的目标分割结果与GT进行比较，即 MP一寺(MPf．+MPfp)， Ⅳfn ∑以脚如一气厂， NfD ∑稚 MPtp2气厂‘ 其中，瓯和砘分别表示第_f个漏检和第k个误检像素到基准分割轮廓的距离；正则化因子D表示一帧内基准目标的所有内部像素到轮廓的距离总和，这个指标基于像素与目标边界的距离来惩罚错误分类的像素，以说明算法提取一个特定物理目标的效果好坏；MP值越低，说明算法从场景中分割物理目标及识别目标边界效果越好． 3)RM(rateofmisclassificationsmetric)．以像素为单位，算法的错误分割像素与目标边界的归一化的平均距离，即 RM一÷(RMfn+RMfp)，表2中，Detectionrate反映了前景像素被正确 ①httpl，／petsmetri。。．酬万方数据第2期李鹏飞，等：智能视频算法评估综述 355 RM萨上Ntn蚤．=老， NfP J‘ RM如一瓦1蚤老；其中，Nh和NfP分别表示漏检和误检像素个数，D曲。是帧的对角距离；RM的计算类似于MP，但是这里使用了FN和FP像素个数作为RM的正则化因子． 4)WQM(weightedqualitymeasuremetric)．检测目标与GT目标之间的空间差异，是漏检和误检像素影响的加权和，即 WQM=In(÷(WQMfn+WQMfp))， 1垒 WQMf．一寺∑‰(以)以， 1’tn j=1 1鱼 WQMtp=寺∑训fp(砟)略；其中，N为参考目标的像素面积．按照Aguilera 等[11的观点，漏检和误检在视觉上的重要性是不同的，应该区别对待，所以使用了权重函数Wfp和Wfn．对于不同的算法，上述4种指标值越小说明算法性能越好．但是这些指标是基于像素来统计的，因此并不能用来衡量实际检测中经常出现的分裂、合并等情况．另外，这几个指标易受大物体的主导，不能反映画面中小物体的漏检．针对运动目标的检测任务，ETISEO提出了由一个主要评估指标结合一些补充的指标组成的评估方法Ⅲ来综合衡量算法在这些任务上的性能．其中的补充度量Objectarea以像素为单位进行统计，计算Detectionrate，Precision及二者的调和平均F— Score，并评估了算法分割目标的精确度．其缺点如前所述，容易偏向于大物体． 2．2目标级别的评估以目标为单位的统计通常通过系统输出目标与 GT目标的空间重叠来判断，有质心位置法L81和面积重叠率法m¨1]2种判断方式．质心位置法就是判断GT目标的质心点是否落在检测目标的边界框内．如果落在边界框内，则认为该GT目标被成功检测，记为一个TP；否则，认为该GT目标未被成功检测，记为一个FN；如果一个检测目标找不到与之匹配的GT目标，则将该检测目标记为一个FP．质心位置检查中，可以将目标边界框适当地扩大一部分，以有效地减少因画面中实际目标过小而导致的漏检及误检的判断．面积重叠率法是指计算在指定帧中的某个GT 目标和某个系统检测目标之间的面积重叠程度，并判断其是否大于一个给定的阈值．如果大于该阈值，说明系统输出和GT目标之间有充分的空间重叠，记为一个丁P；否则，记为一个FP．如果GT目标与任一系统输出没有充分的空间重叠，则记为一个 FN．以目标为单位的统计中，TN不能被明确定义．以目标为单位统计时，表2所提出的指标同样适用．需要注意的是，由于此时无法对TN进行统计，表2中后4个指标无法使用． ETISEO提出的综合指标中，主要评估指标被命名为numberofobjects，是以目标为统计单位，计算检测率、检测准确率及F-Score．这里使用了面积匹配准则来判断算法输出的检测目标与GT目标是否匹配．补充的度量指标中，Splitmetric，Mergemetric 同样以目标为统计单位，其计算方法如下： 1)Splitmetric．量化了检测目标的分裂程度，计算每个GT目标被检测成多少块，即 Spli净忐荟(忐善而1而)；其中，Ni。表示包含至少一个GT目标的帧数，№ 表示某一帧内GT目标的个数，NBloblRD表示某一个GT目标被检测出的块数． 2)Mergemetric．量化了检测目标的重合程度，计算每个检测目标对应的GT目标数，即 Me—g一忐荟(忐善丽1石)；其中，N妇。表示包含至少一个GT目标的帧数，N鼬表示某一帧内检测目标的个数，NRDI鼬表示某一个检测目标对应的GT目标数．另外，ETISEO给出了一种定量计算视频对比度的方法[12。，实现了对视频对比度的准确分级． CLEARLl3。1副中提出了名为MoDA(multiple objectdetectionaccuracy)的度量指标MODA(￡)一1一丛型皂型；』Y0 其中，m。为第t帧内的漏检数，即，为误检数，c为相应的惩罚函数，N0为GT目标数．该指标反映了算法的检测准确度，漏检和误检越多，其值就越小．正则化后的MoDA称作N—MODA， Nf㈣ 2：．(c。(m。)+cy(fp，)) N-MODA一1一上L—瓦了——一， ∑Ng’ 它可以反映算法在整个序列上的性能．万方数据 356 计算机辅助设计与图形学学报第22卷 Nascimento等[91对目标检测的结果做了更为具体的细化，分为正确检测(一一匹配)、合并、分裂、分割合并同时发生、误检和漏检；然后根据上述的统计数据，对正确检测、漏检、分裂、合并、分／合统计值以GT目标数作归一化，计算各自的比率．另外将误检数除以检测所得目标数，即可得误报率．使用这一组指标可以从不同侧面反映算法的检测性能．文献[16]在文献[9]所求的比率基础上，对所有比率进行加权求和用来评估算法的综合性能，但是权值只能依据经验来确定．目前，国内几乎没有对于运动目标检测算法的评估工作，主要使用国际上几个比较通用的指标来说明自己算法的性能．文献[17]使用误检率和漏检率以及这2个比率的和，作为评估指标与他人的算法进行比较．以目标为统计单位的优点在于更贴近人的主观感受，不会偏向于较大的目标．如图3所示，由于画面中的人相对很小，如果检测人失败，而检测画面中的卡车成功，使用以像素为单位统计的度量指标时，对评估结果影响并不大；而使用以目标为单位统计的度量指标时，检测人失败和检测卡车失败对结果的影响是一样的．其缺点在于不能评估算法的精确度，即目标分割的精确度，需要使用其他补充的指标来衡量算法在精确度方面的性能．图3不同大小的物体标注图 2．3像素和目标综合评估有些研究人员将像素和目标2种单位相结合，得出的指标在能够反映检测准确度的同时，还能反映检测精确度． VACE中提出了Fj)A(fl'anledetectionaccuracy) 的度量指标⋯J，对于第t帧，使用N∥表示此帧内的GT目标数，Ng’表示此帧内检测到的目标数，则可以定义胱∽=盏精鲨D；I』YGT』Y I L 2 J 其中，Ov洲眈鼬一蚕8矧胖表示第t帧内的第i个GT目标，D∥表示第t帧内的第i个匹配的检测目标，N篱聃a表示第t帧内匹配的目标数．这里目标的匹配与否使用空间重叠率来判断，选取其中匹配最好的目标作为有效匹配，即GT 目标与检测目标的匹配是一一对应的．该指标综合反映了算法的检测率和检测的精确程度，检测率越高，这个指标值越高，同时检测的精确度越高，指标值也越高．为了评估算法在整个序列上的性能，可以计算该序列每一帧上的FDA，然后对所有的FDA求和，并归一化以序列中存在GT目标或者检测目标的帧数．这种归一化的方法同时考虑了漏检和误检的影响，归一化后的FDA命名为SFDA(sequence framedetectionaccuracy)，表示为 SFDA— Mnme5 ∑FDA(t)、 f一1 ∑了(峭’ORN汐) f一1 与VACE类似，CI。EAR‘13。151也提出了综合像素和目标单位的评估准则MODP(multipleobject detectionprecision)，其形式为 MODP(￡)：_Overila-p—_R—atio 』V‘册州其中，N0，，。表示第t帧检测到的匹配目标的数目， Overlap—Ratio表示匹配的GT目标与检测目标的重叠比率，反映了算法对检测目标的分割精确度．为了得到算法在整个视频序列上的性能表现，可以将 MODP正则化，记作N-MoDP， N_-MoDP— Nhm“ ∑MODP(t) t—l Nf。。。 ’ 2．4小结综上所述，运动目标检测的度量指标可分为像素单位与目标单位两大类．像素单位主要反映了算法分割物体的性能，却不能反映分割时发生的物体分裂、合并等情况．目标单位的统计可以反映算法的分割准确度，更贴近人们的主观感受，却不能反映算法分割的精确程度．因此，为了反映算法的综合性能，不能单独使用某一类型的指标，需要结合2种单位的统计，以获得算法的真实性能．而对于像素和目标单位结合的指标，如果指标较低，用户并不清楚算法具体的缺点是什么，可借鉴E1rIsE0的评估方法．万方数据第2期李鹏飞，等：智能视频算法评估综述 357 3 目标跟踪评估运动目标跟踪是在运动目标检测基础上，利用目标有效特征，使用适当的匹配算法，在序列图像中寻找与目标模板最相似的图像的位置，简单来说就是给目标定位．在实际应用中，运动目标跟踪不仅可以提供目标的运动轨迹和精确定位目标，为下一步的目标行为分析与理解提供可靠的数据来源，而且也可以为运动目标检测提供帮助，从而形成一个良性的循环．与运动检测相比，跟踪是一个时空任务，评估时既需要考虑系统输出与GT的空间符合度，还需要考虑其时间符合度．VACE，CLEAR，ETISEO和 PETS都在目标跟踪评估方面做了一定的T作，并提出了一些评估度量指标，分别从轨迹检测的精确度、完整性等方面对检测算法进行了评估． 3．1轨迹的精确度轨迹的精确度主要指检测轨迹与GT轨迹在空间上的相似性．为了度量目标跟踪算法轨迹检测的精度，Ⅵ～CE中提出了以下指标： STDA(sequencetrackdetectionaccuracy)，即 ‘。乓写‘厂IG∥nD∥|]弋_、l uf uf N瓮ca■LG∥UD尹IJsTDA一菩旦瓦面Fq’I=I ‘ 其中，G尹和DP分别表示第t帧内的第i个匹配的 GT目标和检测目标，Nh一表示该序列的帧数， N。删表示在视频序列级别上匹配的目标总数，G和 Df分别表示在序列级别上的第i个匹配的GT目标和检测目标，N(GUD：／t0)表示存在Gf或者Di的帧数．可以发现，式(1)的分子是检测目标与GT目标的重叠率，与运动检测里非常相似．其区别在于跟踪任务中，需要同时考虑时间和空间上的重叠率，而在检测任务中，仅仅考虑空间上的重叠率．STDA是度量序列上所有目标的跟踪性能的指标，它同时惩罚了漏检和误检．将STDA在序列所有目标(检测目标和GT目标)取平均，得到平均跟踪精度(averagetracking accuracy，ATA)，其中体现了对目标分裂情况的惩罚，而在STDA中没有体现．而对整个序列集的 ATA求取均值，可以得到算法在整个测试序列集上的性能． CLEAR中定义了与STDA类似的指标MOTP (multipleobjecttrackingprecision)，即 ”苌掣”专竿广fG≯nD(f)I] 鲁鲁LG∥U联D JMOTP一』型—』去#二二I_二二—二_二二 ∑睢州，=1 其中，N。，pcd表示在视频序列级别上匹配的目标数，这个指标同样反映了算法检测的精度．文献E8，18-21]对于给定的2个轨迹A和B，计算了轨迹之间的距离序列，并统计了均值、中位数、标准差、最小值和最大值，以度量轨迹检测的精度．其中，文献[-21]以每一对轨迹的时间重叠作为权重系数，计算了整个序列上所有轨迹匹配误差的加权平均，作为序列级的轨迹匹配误差．文献[22]使用 GT目标的大小对检测目标及GT目标在水平、垂直方向上的距离作了归一化，然后分别统计了所得距离序列的均值和方差．文献[-18]中指出一些轨迹之间可能非常相似，仅仅有如图4a所示一些空间或如图4b所示时间上的常量差距． a空间常量差距 b时间常量差距图4轨迹对比图‘”] 为此，作者通过计算2个轨迹之间的最优空间和时间位移，使得2个轨迹之间距离的均值最小；然后对调整后的轨迹分别作上述的统计分析，以进一步发现2个轨迹之间的相似度．另外，文献[183计算了2个轨迹之间的面积，用来评估轨迹检测的精度；而文献[-19，22]则计算了轨迹上检测与GT目标之间的平均面积差异，即矛一1VA1(i)一A2(i)一4 N12争 A1(i) ’ 作者使用GT目标的面积作归一化，有效地消除了目标大小对指标的影响．与STDA类似，文献[-21，23]中使用GT目标与检测目标的重叠比率来衡量目标在某一时刻的跟踪效果，并且对某一帧内的目标重叠率求平均；然后对序列所有帧的平均重叠率取平均，从而得到在整个序列上的跟踪精度． 3．2轨迹的完整性轨迹的完整性主要包括跟踪时间的完整以及轨迹ID的持续性2方面． Black等[8]提出了一种评估度量，通过GT和跟踪目标之间的对应关系，计算TP和FP，进而用来万方数据 358 计算机辅助设计与图形学学报第22卷计算下列的度量． 1)TDR(trackdetectionrate)．跟踪目标的TP 数与该目标对应的所有GT目标数的比值，这个指标值越接近100％，说明轨迹的完整性越高． 2)丁F(trackfragmentation)．与GT轨迹匹配的检测轨迹数量，度量了轨迹ID标号改变的次数．分裂表明对于一个GT轨迹，系统的输出轨迹缺乏连续性．在最理想的情况下，轨迹分裂错误应该为 0，即跟踪系统可以为GT目标生成连续稳定的轨迹． 3)oSR(occlusionsucceB$rate)．成功检测的动态遮挡数与所有的动态遮挡数之间的比率，这个指标衡量了跟踪算法遮挡情况下检测目标的能力． 4)TSR(trackingsuccessrate)．表示跟踪到的没有分裂的目标与所有GT目标总数的比率．文献E8-1提出的度量方法很好地概括了一个跟踪算法中应当被评估的一些基础特征，然而其未对目标大小检测的准确度进行评估．文献l-19，21]提出了以下2个指标来评估轨迹在时间上的性能． 1)Objectdetectionlag．度量了系统开始跟踪一个新目标的时间与GT开始标注该物体的时间的差异，即跟踪算法的延时．延时的理想值应该为0，一个很大的延时意味着系统的灵敏度不够，不能及时地触发跟踪，或者说明检测性能不够好，从而能够触发跟踪． 2)Trackincompleteness．度量了轨迹在时间上的完整性，即了1妇cklncompZe￡e靠已5s2—N——f．—=+丁—N—一fp．』f 其中，N如表示漏检帧数，N如表示误检帧数，t 表示GT和检测结果同时出现的帧数． ETISEO中为了评估跟踪算法检测轨迹的完整性，提出了以下的一系列度量指标①． 1)Linkbetweentwoframes．以2个在连续时刻检测到的物理目标之间的关联为单位，统计GT 目标关联数、漏检关联数、误检关联数；然后计算检测率和检测准确率以及调和平均．它反映了算法在目标时间关联方面的检测能力． 2)Trackingtimeevaluation．衡量了GT目标被观察和跟踪的时间百分比(ID保持不变)．通过空间重叠率来判断GT目标和检测目标是否匹配．选择与GT目标匹配的第一个物理目标或者与GT目标时间重叠最大的目标作为有效匹配，然后计算 GT目标被跟踪的平均时间， TT。eked=志丢号黑舻． 3)PhysicalobjectIDfragmentation．度量了ID 的持续性，衡量整个轨迹发生时间内有多少个跟踪目标与一个GT目标相关联，即胁矗盯册卯一忐荟瓦而未；万丽；其中NumObjectlD，RD表示GT目标所对应的不同 ID数，其值越高，说明算法性能越好(理想情况为 100％)． 4)PhysicalobjectIDconfusioncriterion．度量了 ID的混淆(2个相遇的人的ID互换)．NumReflDfD 表示检测目标所对应的GT目标ID数．不同的GT 目标ID由它们的边界框来定义，且它们与检测目标时间间隔的交集之间相互脱节，即． 1 n 】Co咒fu肌彻一丙二施—NumRe—flDw’ 其中DMRD为detectedobjectmatchrefdata的缩写．混淆度越接近100％，说明跟踪算法在整个时间段上越鲁棒．同样地，Yin等[21]提出了IDC(IDChange)指标，用来统计轨迹在整个生存期内的ID变换次数．他们使用了检测轨迹与某GT轨迹一一匹配(空间重叠)的帧来估计轨迹的ID变化次数，如图5所示，其中虚线表示检测轨迹，实线表示GT轨迹． a轨迹ID改变2次 b无ID改变(轨迹合并)三净j 图5 ID变化示意图口u 3．3 目标跟踪的综合性能轨迹的精确度、完整性分别从不同侧面反映了目标跟踪的性能，二者通常不能单独使用．为了获得目标跟踪算法的一个综合性能，人们也提出了一些综合性的指标． CLEAR提出了评估指标Mj研随(multipleobject ①http：f7唧·sop．in血．fr，or／on／E1"ISF．O／iso_album／ed-metr／a&finidon’ v2．pdf ：l口2 万方数据第2期李鹏飞，等：智能视频算法评估综述 359 trackingaccuracy)，用来评估跟踪算法的综合性能，即 Ⅳf ∑(Cm(mf)+印(即f)+In(／d，)) MOTA=1一』生————可i=——————一； ∑腿 I置l 其中，m。为第t帧内的漏检数，fp。为误检数，c为相应的惩罚函数，N毛为GT目标数，i以表示第t帧内检测目标的ID与前一帧相比的错误匹配数．这样，如果在跟踪过程中一个轨迹发生了分裂或者合并，那么将其作为新轨迹来考虑，但是通过ID的变换来惩罚． Yin等[2嵋判断系统输出轨迹与GT轨迹之间的空间和时间重叠，统计了以下的数据：如果系统输出轨迹与GT轨迹之间有充分的时间和空间重叠，则认为该GT轨迹被正确检测出来，称为TP，或者正确检测轨迹(CDT)．如果系统轨迹与任一个GT轨迹之间没有充分的时间重叠或者空间重叠，则认为该轨迹是一个错误报警轨迹(FAT)，或者是FP．如果GT轨迹与任一个系统输出轨迹之间没有充分的时间重叠或者空间重叠，则认为该GT轨迹未被检测出来，称为轨迹检测失败(TDF)．在上述的统计数据基础上，文献C21]计算了轨迹单位的检测率、误检率、漏检率指标，此种以轨迹为单位的统计应该更接近用户的感受． Muller—Schneiders等n9]通过GT和跟踪算法结果的边界框质心之间的距离矩阵确定阈值，该阈值被用来寻找跟踪算法输出和GT之间对应．同样以轨迹为单位，他们计算了漏检率、误检率指标；同时，指出如果在降低误报方面对系统进行优化时，可能会需要使用一些干扰信息比较强的序列(晃动的树)．而在空场景下，因为GT轨迹总数为0，无法计算误检率，可对公式做出修正，使用序列帧数代替 GT轨迹总数作为分母，从而可以计算一组包含空场景序列上的该指标的均值．与文献[19，213类似，ETISEO中提出了physical object2Dtrajectories的指标，以检验物理目标在它们的生存期内的2D轨迹是否被正确检测，即与GT 轨迹相关的检测轨迹数目．2个轨迹之间的匹配通过计算轨迹之间的最大距离是否大于某个阈值来判断，如果有数个跟踪目标的轨迹与同一个GT目标相关，则将总体时间上与GT目标的空间重叠率最大的那个作为有效的轨迹．此指标以轨迹为单位计算检测率、检测准确率和F-Score．指标numberofobjectbeingtrackedduringtime，在检测目标和GT目标的持续时间之内统计GT目标数、漏检数、误检数，然后计算检测率和检测准确率以及调和平均．这个指标衡量了在一定时间内系统检测和跟踪一个目标的综合能力． 3．4小结综上所述，目标跟踪算法的评估主要可分为轨迹检测的精确度、完整性等几个方面．与目标检测类似，单独使用某一方面的度量并不能够反映跟踪算法的真实性能．从用户的直观感受考虑，应当先使用综合性质的指标(轨迹单位的统计)获得算法的综合性能，然后从轨迹的精度(重叠面积)和完整性(轨迹 ID变换次数、轨迹检测延时)方面对算法进行进一步的评估．可根据用户关注点的不同选择具体指标． 4 总结本文介绍了目前国际上对于智能视频算法评估方面的工作．通过对这些工作的分析可以发现，已有的用于评估智能视频算法的度量指标虽然很多，但是并没有形成一个公认的、统一的标准，这导致算法的设计者在选择评估指标时无所适从，而且指标过多，导致算法之间不容易比较．另外，前期的评估工作中并没有给出一个基准，没有指出评估指标在大于或者小于哪个阈值时，该算法是一个比较好的算法．在评估过程中，同时使用多个度量指标或者只使用一个全面的度量指标来衡量被测系统的性能，在不同的人看来有着不同的观点．从研究者的角度来看，评估指标越多、越具体越好，多个指标同时使用可以帮助研究人员发现算法的具体缺点，从而辅助调试改进算法．然而，在最终用户看来，需要从大量的良莠不齐的智能视频产品中选取其中的某一个，这时，一个综合的度量指标将有助于他们最初的分析，可以使用户迅速地排除其中的某些设备，然后再使用其他具体的度量指标来做更深层次的分析，帮助用户做出最后的选择．此外，目前国际上智能视频的评估工作主要关注算法的评估，几乎没有以产品和系统评估为目的的工作，由于关注点的不同，已有的指标并不一定适用于产品的评测，需要将监控设备硬件供应商、智能视频算法设计者、智能视频用户合理的组织起来，讨论提出一个适用于产品评估的一个标准，这将是今后智能视频评估的一个发展方向．万方数据 360 计算机辅助设计与图形学学报第22卷参考文献(References)： [13AguileraJ。WildenauerH，KampelM，eta1．Evaluationof motionsegmentationqualityforaircraftactivitysurveillances [C]／／Proceedingsof the2ndJointIEEEInternational WorkshoponVisualSurveillanceandPerformanceEvaluation ofTrackingandSurveillance，Bering，2005：293—300 [2]ThirdeD，BorgM。ValentinV，eta1．Visualsurveillancefor aircraftactivitymonitoring[c]／／Proceedingsofthe2ndJoint IEEEInternationalWorkshoponVisualSurveillanceand PerformanceEvaluationof TrackingandSurveillance， Beijing，2005{255—262 [3]YoungDP，FerrymanJ M．PETSmetrics：on—line performanceevaluationservice[c]／／Proceedingsofthe2nd JointIEEEInternationalWorkshoponVisualSurveillanceand PerformanceEvaluationof TrackingandSurveillance， Beijing，2005：317_324 [4]Lazarevic—McManusN，RennoJ，MakrisD，etal．Designing evaluationmethodologies：thecaseofmotiondetection[c]／／ Proceedingsofthe9thIEEEInternationalWorkshopon PerformanceEvaluationofTrackingandSurveillance，New York，2006：23-30 [5]GrabnerH。RothPM，BischofH．Ispedestriandetection reallyahardtask?[c]／／Proceedingsofthe10thIEEE InternationalWorkshoponPerfc}rmanceEvaluationof TrackingandSurveillance，RiodeJaneiro·2007：1-8 [6]EllisT．Performancemetricsandmethodsfortrackingin surveillance[c]／／Proceedingsofthe3rdIEEEInternational WorkshoponPerformanceEvaluationof Trackingand Surveillance，Copenhagen，2002：26—31 [7]NghiemAT，BremondF，ThonnatM，eta1．ETISEO。 performanceevaluationforvideosurveillancesystems[c]／／ ProceedingsoftheIEEEConferenceonAdvancedVideoand SignalBasedSurveillance．London．2007：476—481 [8]BlackJ，EllisT，RosinP．Anovelmethodforvideotracking performanceevaluation[c]／／Proceedingsofthe2ndJoint IEEEInternationalWorkshoponVisualSurveillanceand PerformanceEvaluationofTrackingandSurveillance，Nice， 2003：125-132 [9]NascimentoJ C，MarqueJ S．Performanceevaluationof objectdetectionalgorithmsforvideosurveillance[J]．IEEE TransactionsonMultimedia，2006。8(4)：761-774 ElO]HallD，NascimentoJ，RibeiroP，eta1．Comparisonoftarget detectionalgorithmsusingadaptivebackgroundmodels[c]／／ Proceedingsofthe2ndJointIEEEInternationalWorkshopon VisualSurveillanceandPerformanceEvaluationofTracking andSurveillance，Beijing，2005：113—120 [11]ManoharV，BoonstraM，KorzhovaV。甜a1．PETsvs． VACEevaluationprograms：acomparativestudy[C]／／ Proceedingsofthe9thIEEEInternationalWorkshopon PerformanceEvaluationofTrackingandSurveillance，New York，2006±1—6 [12]NghiemAT。BremondF，ThonnatM。eta1．Anew evaluationapproachforvideoprocessingalgorithms[C]／／ ProceedingsofIEEEInternationalWorkshoponMotionand VideoComputing，Austin，2007l 15-22 [13]KasturiR。GoldgofD，SoundararajanP．eta1．Framework forperformanceevaluationofface，text，andvehitiedetection andtrackinginvideo：data，metrics，andprotocol[J]．IEEE TransactionsonPatternAnalysisandMachineIntelligence， 2009，31(2)：319-336 [14]StiefelhagenR，BernardinK，BowersR，eta1．TheCLEAR 2006evaluationFM]／／LectureNotesinComputerScience． Heidelberg：Springer，2007，4122：1—44 [15]StiefelhagenR，BernardinK，BowersR。eta1．TheCLEAR 2007evaluation[M]／／LectureNotesinComputerScience． HeidelberglSpringer，2008，4625：3-34 [16]GelascaED，EbrahimiT．Applicationdependentvideo segmentationevaluation：acasestudyforvideosurveillance rOLl．[2009-03-04]．http：／／infoscience．epa．ch／record／91012 [17]ChuYiping，ZhangYin，YeXiuzi，eta1．Adaptivevideo segmentationalgorithmusinghiddenconditionalrandomfields [J]．ActaAutomaticaSinica，2007，33(12)：1252-1258(in Chinese) (褚一平，张引，叶修梓，等．基于隐条件随机场的自适应视频分割算法[J]．自动化学报，2007，33(12)：1252—1258) [18]NeedhamCJ，BoyleRD．Performanceevaluationmetricsand statisticsforpositionaltrackerevaluation[M]／／LectureNotes inComputerScience．Heidelberg：Springer，2003，2626： 278-289 [19]Muller-Schneiderss，JagerT，LoosHS，eta1．Performance evaluationofarealtimevideosurveillancesystem[C]／／ Proceedingsofthe2ndJointIEEEInternationalWorkshopon VisualSurveillanceandPerformaneeEvaluationofTracking andSurveillance，Beijing，2005：137—144 [20]BashirF，PorikliF．Performanceevaluationofobject detectionandtrackingsystems[c]／／Proceedingsofthe9th IEEEInternationalWorkshoponPerformanceEvaluationof TrackingandSurveillance，NewYork，2006：7-14 [21]YinF，MakrisD，VelastinS．Performanceevaluationof objecttrackingalgorithms[c]／／Proceedingsofthe10thIEEE InternationalWorkshopon PerformanceEvaluationof TrackingandSurveillance，RiodeJaneiro。2007：17-24 [22]Zivkovicz，KrOseB．AprobabilisticmodelforanEM—like obiecttrackingalgorithmusingcolor—histograms[C]ff Proceedingsofthe6thIEEEInternationalWorkshopoff PerformanceEvaluationof TrackingandSurveillance， Prague，2004I 73—82 [23]GuhaP，MukerjeeA，VenkateshKS．Efficientocclusion handlingformultipleagenttrackingbyreasoningwith surveillanceeventprimitives[c]，／Proceedingsofthe2nd JointIEEEInternationalWorkshoponVisualSurveillanceand PerformanceEvaluationof TrackingandSurveillance， Beijing·2005：49—56 万方数据智能视频算法评估综述作者：李鹏飞，陈朝武，李晓峰， Li Pengfei， Chen Chaow

                    本文档为【智能视频算法评估综述】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

智能视频算法评估综述

你可能还喜欢