《第六讲感知智能.docx》由会员分享,可在线阅读,更多相关《第六讲感知智能.docx(4页珍藏版)》请在第壹文秘上搜索。
1、第六讲感知智能教学内容:本章主要学习感知智能基本技术、数字图像处理、计算机视觉、模式识别、深度学习目标检测应用。教学重点:计算机视觉、模式识别。教学难点:深度学习目标检测应用。教学方法:课堂教学为主,结合智慧树等在线平台实时提问、收集学生学习情况,充分利用网络课程中的多媒体素材来表示感知智能技术的实现原理和过程。讨论五分钟。课后布置作业,要求学生查找、阅读与计算机视觉、模式识别有关的经典论文等。学习慕课第六章感知智能并完成章节测试。教学要求:重点掌握数字图像处理原理、图像分割、图像分类方法,计算机视觉原理、机器视觉原理机器应用、模式识别原理。课程思政内容:本章无相关内容。学习目标:1 .熟悉感
2、知智能的基本概念,数字图像处理技术和方法。2 .理解计算机视觉与机器视觉。3 .掌握模式识别与图像分类。4 .了解人脸识别系统及其实现方法与基于深度学习目标检测与识别。5 .了解无人驾驶环境感知技术。学习导言感知智能是从机器智能角度来刻画机器对外界的感知能力,通过摄像头、麦克风或者激光雷达、超声波传感器等其他传感器硬件设备采集物理世界的信号,对人或者动物的听觉、触觉、力觉、味觉、嗅觉等功能进行模拟,借助语音识别、图像识别等前沿技术,映射到数字世界,再将这些数字信息进一步提升至可认知的层次,比如记忆、理解、规划、决策等等。人的感官通常是视觉占了80%的信息输入,然后是听觉和触觉。但机器拥有超越人
3、的可视范围的视觉,包括红外、激光雷达,可以感知距离,也可以用亳米波去感知细微的距离或速度,这些都意味着机器可感知的物理世界信号或模态是比人类更多更丰富的。在人工智能系统迅速发展的今天,感知智能在诸多领域,如机器视觉、指纹识别、目标识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、态势感知、无人驾驶等领域取得了辉煌的成就。目前,感知智能研究更多是基于大数据深度学习对感知对象特征提取,以及基于各种特征的类生物机制的推理方法等,主要侧重于机器视觉方面,这是因为其它的感知能力对实现机器智能还没有像视觉应用一样广泛,因此,实际发展的感知智能以图像处理、机器视觉、计算机视觉为主,以及从指纹识别到人脸识别等不
4、同的生物特征识别技术。感知智能需要模仿人和动物的多种功能,来完成对象的特征提取和分类。目前,自然界人和动物认识客观对象的多传感信息融合机理还远远没有揭示出来,但我们已经初步了解人类大脑信息处理的部分机制,尤其是视觉信息在大脑皮层的处理机制。目前,机器感知智能主要是受到人类视觉启发的,但在实际发展和应用中,机器已经形成了不同于人类视觉的视觉智能。在实际中,广义的机器视觉的概念与计算机视觉没有多大区别,泛指使用计算机和数字图像处理技术达到对客观事物图像的识别、理解,在人工智能领域,图像处理已经成为机器感知智能特别是机器视觉智能的基础。5.1 数字图像处理技术图像处理,也称为数字图像处理(DigiI
5、aIImageProCeSSing)或计算机图像处理,是指将图像信号行分析、加工、和处理,转换成数字信号并利用计算机对其进行分析的过程。图像处理是信号处理在图像领域上的一个应用。图像处理方法可分为空域法和频域法,在空间域中,把图像看作是平面中的一个集合,用一个二维的函数来表示,集合中的每一个元素就是图像中的一个像素,图像在计算机内部被表示为一个数字矩阵。图像分析是从图像中抽取某些有用的度量、数据或信息,目的是得到某种数值结果,而不是产生另一个图像。图像分析和模式识别、知识表达等人工智能的内容有交叉,不仅要把图像中的特定区域按固定数目的类别加以分类,更主要是提供关于被分析图像的一种描述(解释),
6、主要技术方法包括但不局限于图像处理的各种技术。图像分析的主要过程如下:(1)分割先把图像分割成一些互不重叠的区域,每一区域是像素的一个连续集,抽取出图像的特征,包括不同特征的物体和背景,其中可能包含某些形状,如长方形、圆、曲线及任意形状的区域。(2)识别或分类以特征为基础进行识别或分类是计算机理解景物的基础,利用图像的相似度:一种简单的相似度可用区域特征空间中的距离来定义;另一种基于像素值的相似度量是利用图像函数的相关性;还有一种定义在关系结构上的相似度称为结构相似度。6 .2计算机视觉与机器视觉1 .计算机视觉计算机视觉(ComputerVision,CV)是一门研究如何让计算机达到像人类那
7、样“看”的技术。更准确点说,它是利用摄像机等图像传感器或光学传感器代替“人眼”,使其构成的计算机视觉系统拥有类似于人类的那种对目标进行感知、识别和理解的功能,是对生物视觉的一种模拟。计算机视觉以图像处理、信号处理、概率统计分析、计算几何、神经网络、机器学习和计算机信息处理等技术为基础,借助几何、物理和学习技术来构建模型,用统计的方法处理数据,具有通过二维图像认知三维环境信息的能力。2 .机器视觉研究面向应用的计算机视觉系统的设计与实现技术,称为机器视觉。两者有着相同的理论基础,并没有很清晰的界限,只是在实际应用中有所侧重。相对于计算机视觉,机器视觉更工程一些,自动化行业中应用的多。机器视觉代替
8、人类视觉自动检测产品外形特征,实现100%在线全检,已成为解决各行业制造商大批量、高速、高精度产品检测的主要趋势,如图6.20所示的机器视觉检测。工业上,由于机器视觉用机器代替人眼来做测量和判断,因此又称为工业机器视觉。3 .3模式识别与图像分类模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、信号、数字、字符、文字和图形自动完成识别的过程。模式识别包括相互关联的两个阶段,即学习阶段和实现阶段,前者是对样本进行特征选择,寻找分类的规律,后者是根据分类规律对未知样本集进行分类和识别。广义的模式识别属计算机科学中智能模拟的研究范畴,内容非常广泛,包
9、括声音和语言识别、文字识别、指纹识别、声纳信号和地震信号分析、照片图片分析、化学模式识别等等。计算机模式识别实现了部分脑力劳动自动化,对于机器的感知智能而言,主要从模拟人类视觉的模式识别对图像、视频等进行分析和分类处理。经过几十年的迅速发展,如今模式识别己经广泛应用于各个领域。一个完整的模式识别过程包括:学习模块、测试模块和验证模块三个主要部分。图6.22模式识别的流程图其中,学习模块主要是对模型的构建和训I练,验证模块主要对模型进行验证,测试模块主要完成最后模型性能的测试。具体实现过程:首先构建模型,同时将样本参考一定比例分成训练集、验证集以及测试集,之后采用训练集中的训练样本对模型进行训练
10、,每次训练完成一轮之后在验证集上测试一轮,待所有样本均训练完成之后最后在测试集上再次测试模型的准确率和误差变化。图像分类图像分类是指根据一定的分类规则将图像自动分到一组预定义类别中的过程。图像分类常采用经典的模式识别方法,例如统计模式分类和结构模式分类等,这类传统方法可能对于一些简单的图像分类是有效的,但由于实际情况往往非常复杂,分类效果不一定好。一般图像分类的基本过程是建立图像内容的描述,然后利用机器学习方法学习图像类别,最后利用学习得到的模型对未知图像进行分类。实例:人脸识别系统及其实现方法人脸识别技术是基于人的脸部特征,对输入的人脸图像或者视频流进行判断。首先判断其是否存在人脸,如果存在
11、人脸,则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息,并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份。人脸识别系统主要包括四个组成部分:人脸图像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别。4 .4深度学习在目标检测及识别的应用YOLO算法均匀的在图片不同尺度的不同位置上进行密集的抽样,然后利用CNN提取特征后直接进行分类和回归,将目标检测中候选区域的选择和目标预测边框回归集成到一个网络中,整个过程只需要一步,在检测速率上有明显提高。YOLo第一次实现将物体检测作为回归问题求解,基于一个单独的端对端的网络,完成从原始的图像的输入到物体位置和类别及相应的置信概率的输出。大大的提升了检测速度,使得YoLO每秒能够处理45张图片,而且每个网格在预测目标时采用的是全局信息。YoLO算法已经进化到YOLOV3代,算法的性能在不断的改进,是目前效果优良的开源目标检测算法之一,在保持良好的实时性的同时,也能获得很好的检测精度。采用YoLOV3算法对周围环境中的物体进行实时检测与识别,实验场景选取为办公室环境,办公室中存在的被检测物包括桌子、椅子、显示器、水杯、盆栽等物体,检测识别效果如图6.31所示。具体实现可见链接: