海底底質類型是重要的海洋環境參數,是進行海底科學研究的基礎,海底底質分類對于海洋工程建設、海底科學研究、海洋資源開采具有重要的科學與實際意義。傳統的底質分類依靠機械進行直接采樣來確定沉積物的類型及分布,該方法效率低、采樣數據離散,不適合進行大面積的調查分類。聲學方法遙測海底類型根據海底底質的反射系數、聲速、散射等聲學特性反演出底質的類型、粗糙度、硬度等屬性,具有效率高、費用低、獲取內容豐富連續的特點,為海底分類提供了快速可靠的方法。對于單波束、淺地層剖面儀等正入射儀器進行底質分類的主要方法有海底聲學參數反演法、統計特征分析法等;對于多波束、側掃聲吶等斜入射儀器進行底質分類的主要方法有反向散射強度分析法、圖像紋理特征分析法等。目前,對于回波信號的統計多基于回波信號的波形特征,對聲吶回波能量特征研究較少。
淺地層剖面儀(Sub-bottom Profiler),簡稱“淺剖”,是一種用于獲知海床以下淺部地層信息的聲學探測設備,是進行海洋地質勘探常用的設備之一,其工作時通過發射換能器垂直向海底發射聲波信號,聲波穿透水層、海底地層,下行過程中經各層介質的濾波,遇聲阻抗界面返回,最終攜帶有界面層信息的反射聲波被接收單元接收。相較于其它設備,淺剖具有發射頻率低、底質穿透力強的特點,獲得的回波信號可攜帶很豐富的沉積物特征。本文主要對不同底質下淺地層回波信號的能量序列進行分析,提取海底淺層沉積物的回波能量序列進行地質分類。
一、淺表地層回波能量序列
淺剖在工作中發射的脈沖強度是固定的,接收的回波強度由于深度和海底不同沉積物的反射系數、硬度、粗糙度等物理性質不同,其回波的能量序列特征也有所不同。具體表現為:⑴回波能量序列的總強度不同。不同底質之間回波能量序列的總強度存在較大差異,且與深度有關,深度較淺回波能量序列的總強度較強,較深回波能力較弱。⑵回波能量序列分布特征不同。淺剖發射的脈沖信號接觸到海底沉積物受到反射的同時,也會有一部分能量被吸收,利用反射的部分可以進行測深,而不同的沉積物對聲波的吸收不同,其能量分布存在較大的差異。⑶回波能量序列分布與換能器的工作頻率有關。工作頻率越低,其回波能量的平均強度越高,且出現波峰的序列越多,工作頻率越高,其回波總能量越低,波峰數量越少。
對淺表層回波信號數據進行處理,可分離出回波能量序列,接收的1幀數據可以換算為垂直方向上有限的回波能量值,其數量與淺剖的發射頻率、聲速等有關,可將回波能量序列映射為水深,計算公式為:
式中:S為1幀中回波能量的數量;n為回波能量的序列值;HMAX為聲吶設置的最大量程,為HMIN測量最小量程。
(a)
(b)
圖1 回波能量序列分布特征
圖1-a為淤泥底質在不同工作頻率下的淺剖能量序列分布情況,高頻(200kHz)下其分布中只出現兩個較為明顯的波峰,第一個波峰為水面反射,第二個波峰為聲波到達海底表面后的反射。低頻(20kHz)下則出現了多個波峰,其平均能量也更高、低頻穿透性較強,其分布更能反映出不同底質的特征。圖1-b為淤泥、砂礫、水泥3種不同底質的回波能量序列分布,可以觀測到不同底質的回波能量序列分布具有差別。
二、底質分類方法
支持向量機(SVM)是一種有監督的分類算法,其最初由Vapnik首先提出,其主要思想是通過映射函數將向量映射到一個更高維的空間,求解一個分類超平面,使正例和反例之間的隔離邊緣被最大化。支持向量機針對有限的樣本數量下的分類問題,根據結構風險最小化原則在保證學習精度的前提下提高了泛化能力。考慮到在實際的勘測工作中,海底樣本采集困難、樣本數量較少,使用支持向量機對海底底質進行分類識別研究。
⒈支持向量機原理
支持向量機最初用于對線性可分問題進行分類,給定訓練樣本﹛(x1,y1),(x2,y2),(x3,y3),Λ(xn,yn)﹜得到期望輸出y∈﹛-1,1﹜。即尋找一個超平面將訓練樣本分離,并使任意樣本的點到超平面的距離大于等于1。用于分類的最優超平面的方程為:
式中:w為法向量;b為截距。滿足上述條件的超平面實際構建了兩個平行的超平面作為間隔邊界以判別樣本的分類:
所有在上間隔邊界上方的樣本屬于正類,在下間隔邊界下方的樣本屬于負類,位于間隔邊界上的正類和負類樣本為支持向量(SupportVector)。對于非線性問題,需適當放松約束條件,引入松弛變量ζi>0,此時的分類條件變為:
當ζi=0時,問題變為線性分類問題,當0<ζi<1時,樣本可落在超平面內并被超平面正確分類,當ζi>1時,允許錯誤分類。松弛因子越大表示對離散點的容忍程度越高。同時為松弛因子加入一個懲罰系數c,以免松弛因子過大。此時的目標函數為:
對于非線性分類問題,可使用映射函數將其轉化為線性可分問題,此時作為決策邊界的超平面表示為wtφ(x)+b=0。公式中φ(x)即為映射函數,可定義映射函數的內積為核函數k(x1,x2)=φ(x1)Tφ(x2)。常見的核函數有多項式核、徑向基(RBF)函數核、拉普拉斯核等。本次實驗使用RBF核函數:
⒉分類處理方法
請輸入標題
在進行底質分類之前,首先對回波能量強度數據進行預處理,根據回波能量序列的特點,最大限度地消除非海底底質因素的影響,提取出代表底質特征部分的序列,對數據進行分類整理,選取適當數量的數據作為SVM的訓練集和測試集,對SVM進行訓練,并用測試集進行測試,得到分類結果。流程如圖2所示:
圖2 底質分類處理流程
回波能量序列分布與深度有關,進行數據選取時,需剔除深度的影響,利用閾值算法來獲取回波能量序列中代表底質特征的部分。如圖3所示設每幀回波能量序列為﹛P1(h1,k1),P2(h2,k2)ΛPn(hn,kn)﹜,其中hi為序列值,ki為能量強度。根據測量時的水深值可根據公式⑴計算出水深的序列D,根據水深序列D設定合適的范圍﹛D∈[hmin,hmax]﹜,如圖3黑色虛線,在設定的閾值內,尋找能量強度的最大值得到水底表面的深度序列h,選取適當的厚度△h,截取海底表面深度h后的[h,h+△h]范圍內的回波能量序列作為底質分類的有效原始數據,即圖3紅色虛線,對數據進行篩選,這樣可以有效地過濾掉水面反射回波、二次回波等其它異常的回波能量。對底質厚度的選取,可在一定的厚度內進行循環測試,根據分類成功的準確率選取合適的底質厚度。
圖3 底質特征數據選取
支持向量機在實際應用中,懲罰參數c與核函數參數g的選擇對于最后的分類效果具有十分重要的影響,選擇恰當的參數十分必要。在原始數據底質已知的情況下,可將參數c與g在一定范圍內取離散值,將原始數據一部分作為訓練集,一部分作為測試集,并對參數進行歸一化處理,歸一化處理可將不同來源的特征數據統一到同一數量級下,消除不同特征間量綱的影響。使用離差標準化,使結果值映射到[0,1]之間,轉換函數如下:
式中:ki表示序列i的能量強度;max﹛ki﹜表示所有樣本數據中回波能量強度最大值;min﹛ki﹜表示所有樣本數據中回波能量強度最小值。訓練完成后利用測試集對分類準確率進行測試,如圖2所示。以測試集的分類準確率作為評價標準,不斷對參數進行優化測試,最終得到一定條件下最佳的懲罰參數c與核函數參數g。
三、實驗數據分析
本次實驗數據來源于山東科技大學海洋測繪重點實驗室消聲水池,該水池長40m,寬6m,水深3~8m。水池池壁放置了消聲材料,水池底部有規律階梯狀布設有卵石、砂礫、淤泥、水泥等不同底質,模擬真實的海洋環境。采集數據用到的儀器為某型號淺地層剖面儀、GPS定位系統、處理軟件南方自由行2016等。設置淺地層剖面儀的最大工作深度為20m,聲速為1500m/s,保持參數不變,分別對淤泥、砂礫、水泥三種底質進行數據采集,每種底質選取不同的點進行5次采集,每個采集點采集數據5分鐘。對數據進行回放,選取其中4組回波較清晰的信號。
每組選取50幀數據,其中100幀作為訓練集,100幀作為測試集,根據上述方法,首先對數據進行處理,利用閾值算法截取底質能量序列。如圖4所示,為了剔除水深的影響,截取的序列為表面波峰后的13列??梢杂^測到不同底質之間的回波能量序列具有較明顯的差異。水泥底質回波序列中會有一個明顯的波峰,砂礫底質與水泥底質相比波峰較小,且波峰序列靠前,淤泥底質回波序列其能量強度緩慢下降。
圖4 不同底質回波能量序列
選取能量回波序列的多少即選取的底質厚度不同,對分類結果影響很大,默認SVM參數c=1,g=1,不同厚度下的分類結果如表1所示:
表1不同序列長度下分類準確率
序列長度 |
底質厚度/m |
分類準確率/% |
5 |
0.33 |
80.67 |
6 |
0.40 |
72.67 |
7 |
0.47 |
67.33 |
8 |
0.54 |
73.00 |
9 |
0.60 |
76.67 |
10 |
0.67 |
75.33 |
11 |
0.74 |
80.00 |
12 |
0.80 |
88.33 |
13 |
0.87 |
95.33 |
14 |
0.94 |
93.67 |
通過表1觀察到,在SVM參數不變的情況下,截取能量序列長度為13時分類準確率為95.33%,而選取序列長度為7時分類準確率僅為67.33%,本次所取的能量強度序列為13,其對應的底質厚度為0.87m。
本次測試集的底質類型已知,設定不同的參數c,g利用訓練集進行訓練,訓練完成后利用該支持向量機對測試集進行分類,預測結果與實際底質類型結果對比可選出最優的參數c與g,如圖5所示。
(a)
(b)
圖5 SVC參數優化示意圖
先在較大范圍內粗略的選取c與g,將c與g范圍設為[2-4,24],遞進步長取2為底的冪指數0.5,結果如圖5-a所示,在log2g=0處,即g=1處分類準確率較高,且參數g對分類準確率影響較大,進一步縮小范圍,將c設為[0,2]步進間隔為0.1,將g設為[0,2]步進間隔為0.01,得到結果如圖5-b所示。在這種條件下的最優參數為c=1,g=1.01。
利用優化參數后的支持向量機,對測試集3類底質共300個樣本數據進行自動分類,分類結果如圖6所示,預測底質類型與測試集已知的底質類型相同,分類準確率為96%。其中淤泥有2個樣本被錯分為水泥,水泥有10個樣本被錯分為淤泥。
圖6 底質分類測試結果
四、結論
從淺地層剖面儀回波信號中提取的回波能量序列,可有效地應用于海底底質分類。本文總結了淺地層回波信號能量序列的特征,提出了一種簡單有效的截取含有底質特征的回波能量序列的方法。在分類方法上,利用SVM算法進行分類,優化了SVM的參數,使其在一定意義上達到了最優,在實驗水池進行數據采集,淺剖工作狀態與工作環境較為理想,且采集的底質數據樣本數量較少,每個底質類型用于訓練的數據相似度較高,所以取得了很高的分類精度。淺地層剖面儀在實際的測量工作中面臨船運動、環境噪聲等多種因素的影響,且海底底質類型復雜多變,需要進一步利用淺剖采集真實的海底底質數據,并在數據預處理、底質特征選取以及多底質類型分類等方面進行更深入的研究。
【作者簡介】文/鄭旭 羅宇 施劍 吳逸凡 李斌,分別來自山東科技大學測繪學院和自然資源部第二海洋研究所。第一作者鄭旭,1997年出生,男,碩士研究生,主要從事海洋測繪、聲吶信號處理和并行優化技術研究;第二作者羅宇,1974年出生,男,博士,教授,主要從事聲學信號處理研究;通訊作者施劍,1978年出生,男,博士,副教授,主要從事水聲探測與定位研究。文章來自《海洋技術學報》(2020年第6期),參考文獻略,用于學習與交流,版權歸作者及出版社共同擁有,本文編發已取得授權。
中國水產科學研究院南海水產研究所 Copyright ? 2008-2009 ICP備案號:粵ICP備xxxxxxxx號