監督分類檢視原始碼討論檢視歷史
監督分類是是指全國科學技術名詞審定委員會公布的科技名詞。
漢字是民族靈魂的紐帶,在異國他鄉謀生,漢字[1]便是一種寄託,哪怕是一塊牌匾、一紙小條,上面的方塊字會像磁鐵般地吸引着你,讓你感受到來自祖國的親切。因為那中國人的情思已經濃縮為那最簡單的橫豎撇捺[2]。
名詞解釋
監督分類又稱訓練場地法、訓練分類法,是以建立統計識別函數為理論基礎、依據典型樣本訓練方法進行分類的技術,即根據已知訓練區提供的樣本,通過選擇特徵參數,求出特徵參數作為決策規則,建立判別函數以對各待分類影像進行的圖像分類,是模式識別的一種方法。要求訓練區域具有典型性和代表性。判別準則若滿足分類精度要求,則此準則成立;反之,需重新建立分類的決策規則,直至滿足分類精度要求為止。
監督分類是遙感圖像分類的一種,即用被確認類別的樣本像元去識別其他未知類別像元的過程。已被確認類別的樣本像元是指那些位於訓練區的像元。在這種分類中,分析者在圖像上對每一種類別選取一定數量的訓練區,計算機計算每種訓練樣區的統計或其他信息,每個像元和訓練樣本作比較,按照不同規則將其劃分到和其最相似的樣本類。監督分類可分兩個基本步驟:選擇訓練樣本和提取統計信息,以及選擇分類算法。
樣本和統計
訓練樣本的選擇需要分析者對待分類圖像所在區域有所了解,或進行過初步的野外調查,或研究過有關圖件和高精度的航空照片。其最終選擇的訓練樣本應能準確地代表整個區域內每個類別的光譜特徵差異。顯然,訓練樣本的選擇時監督分類的關鍵。因此,同一類別的訓練樣本必須是均質的,不能包含其他類別,也不能是和其他類別之間的邊界或混合像元;其大小、形狀和位置必須能同時在圖像和實地(或其他參考圖)容易識別和定位。
在選擇訓練樣本時,還必須考慮每一類別訓練樣本的總數量。作為一個普遍的規則,如果圖像有N波段,則每一類別至少應該有10N個訓練樣本,才能滿足一些分類算法中計算方差和協方差矩陣的要求。總的樣本數量應根據區域異質程度而有所不同。
訓練樣本的來源可以有以下幾種:
①實地收集,即通過GPS定位而實地記錄的樣本;
②屏幕選擇,利用先驗知識直接從圖像中提取訓練數據的做法比較普遍與合理。
選擇訓練樣本後,為了比較與評價樣本好壞,需要計算各類別訓練樣本的基本光譜特徵信息,通過每個樣本的基本統計值(如均值、標準方差、最大值、最小值、方差、協方差矩陣、相關矩陣等),檢查訓練樣本的代表性,評價樣本好壞,選擇合適波段。評價訓練樣本的方法有兩種:圖表顯示和統計測量。
圖表顯示是將訓練樣本的直方圖、均值、方差、最大值及最小值繪製成線狀、散狀等圖,目視評價各類別訓練樣本的分布、離散度和相關性,例如均值圖、直方圖、特徵空間二維圖等。
統計測量是利用統計方法來定量衡量訓練樣本之間的分離度。對於任何一個多波段圖像,我們總希望用最少的波段來區分不同類別,從而達到最高分類精度。通常對於訓練樣本,要按照一定決策規則檢查兩種類型的誤差:①錯分誤差,即像元被分到一個錯誤的類別;②漏分誤差,即像元沒有被分到其對應的類別。
對於不同的應用環境,監督分類中訓練樣本的選擇及對其統計評價的步驟和方法都會有所不同,基本操作過程為:
(1)收集有關分類區的信息,以了解該區主要分類類別及分布狀況;
(2)對圖像進行檢查,對照已有參考數據或實地考察,評價圖像質量,檢查其直方圖,決定是否需要別的預處理,並確定其分類系統;
(3)在圖像上對每一類按照上文提到的標準選擇訓練樣本,其必須是容易識別的,均勻分布於全圖;
(4)對每一類別的訓練樣本,檢查顯示其直方圖,計算、檢查其均值、方差、協方差矩陣,以及其對應的特徵空間相關波譜橢圓形圖和指示其分離度的不同統計指數等,從而評估其訓練樣本的有效性;
(5)根據(4)中的檢查和評估,修改訓練樣本,必要時重新選擇和評估訓練樣本;
(6)將訓練樣本信息運用於合適的分類過程中。
參考文獻
- ↑ 中國「漢字」從何而來?每個漢字,都是倉頡造出來的嗎?,搜狐,2022-10-01
- ↑ 書寫橫豎撇捺,展示漢字之美,搜狐,2021-01-11