监督分类
监督分类是是指全国科学技术名词审定委员会公布的科技名词。
汉字是民族灵魂的纽带,在异国他乡谋生,汉字[1]便是一种寄托,哪怕是一块牌匾、一纸小条,上面的方块字会像磁铁般地吸引着你,让你感受到来自祖国的亲切。因为那中国人的情思已经浓缩为那最简单的横竖撇捺[2]。
目录
名词解释
监督分类又称训练场地法、训练分类法,是以建立统计识别函数为理论基础、依据典型样本训练方法进行分类的技术,即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类,是模式识别的一种方法。要求训练区域具有典型性和代表性。判别准则若满足分类精度要求,则此准则成立;反之,需重新建立分类的决策规则,直至满足分类精度要求为止。
监督分类是遥感图像分类的一种,即用被确认类别的样本像元去识别其他未知类别像元的过程。已被确认类别的样本像元是指那些位于训练区的像元。在这种分类中,分析者在图像上对每一种类别选取一定数量的训练区,计算机计算每种训练样区的统计或其他信息,每个像元和训练样本作比较,按照不同规则将其划分到和其最相似的样本类。监督分类可分两个基本步骤:选择训练样本和提取统计信息,以及选择分类算法。
样本和统计
训练样本的选择需要分析者对待分类图像所在区域有所了解,或进行过初步的野外调查,或研究过有关图件和高精度的航空照片。其最终选择的训练样本应能准确地代表整个区域内每个类别的光谱特征差异。显然,训练样本的选择时监督分类的关键。因此,同一类别的训练样本必须是均质的,不能包含其他类别,也不能是和其他类别之间的边界或混合像元;其大小、形状和位置必须能同时在图像和实地(或其他参考图)容易识别和定位。
在选择训练样本时,还必须考虑每一类别训练样本的总数量。作为一个普遍的规则,如果图像有N波段,则每一类别至少应该有10N个训练样本,才能满足一些分类算法中计算方差和协方差矩阵的要求。总的样本数量应根据区域异质程度而有所不同。
训练样本的来源可以有以下几种:
①实地收集,即通过GPS定位而实地记录的样本;
②屏幕选择,利用先验知识直接从图像中提取训练数据的做法比较普遍与合理。
选择训练样本后,为了比较与评价样本好坏,需要计算各类别训练样本的基本光谱特征信息,通过每个样本的基本统计值(如均值、标准方差、最大值、最小值、方差、协方差矩阵、相关矩阵等),检查训练样本的代表性,评价样本好坏,选择合适波段。评价训练样本的方法有两种:图表显示和统计测量。
图表显示是将训练样本的直方图、均值、方差、最大值及最小值绘制成线状、散状等图,目视评价各类别训练样本的分布、离散度和相关性,例如均值图、直方图、特征空间二维图等。
统计测量是利用统计方法来定量衡量训练样本之间的分离度。对于任何一个多波段图像,我们总希望用最少的波段来区分不同类别,从而达到最高分类精度。通常对于训练样本,要按照一定决策规则检查两种类型的误差:①错分误差,即像元被分到一个错误的类别;②漏分误差,即像元没有被分到其对应的类别。
对于不同的应用环境,监督分类中训练样本的选择及对其统计评价的步骤和方法都会有所不同,基本操作过程为:
(1)收集有关分类区的信息,以了解该区主要分类类别及分布状况;
(2)对图像进行检查,对照已有参考数据或实地考察,评价图像质量,检查其直方图,决定是否需要别的预处理,并确定其分类系统;
(3)在图像上对每一类按照上文提到的标准选择训练样本,其必须是容易识别的,均匀分布于全图;
(4)对每一类别的训练样本,检查显示其直方图,计算、检查其均值、方差、协方差矩阵,以及其对应的特征空间相关波谱椭圆形图和指示其分离度的不同统计指数等,从而评估其训练样本的有效性;
(5)根据(4)中的检查和评估,修改训练样本,必要时重新选择和评估训练样本;
(6)将训练样本信息运用于合适的分类过程中。
参考文献
- ↑ 中国“汉字”从何而来?每个汉字,都是仓颉造出来的吗?,搜狐,2022-10-01
- ↑ 书写横竖撇捺,展示汉字之美,搜狐,2021-01-11