遥感技术是监测城市发展和变化的主要手段。利用时间域与NDVI数据成为城镇化过程中建成区检测的发展趋势[1, 2, 3, 4, 5, 6, 7]。 过去,一般都是利用两到三景遥感图像,较少利用多个时间序列与季节的信息进行监测城镇化发展进程[8, 9]。城镇化过程中,一般发展为新城区的主要是耕地,其他土地类型比重很小,而且城区一般不太可能被转回为耕地。因此,主要关注耕地与建设用地的混分问题。一年中至少有一个季节会被种上植被的概率较高,通过多个年份和不同季节的数据可以区分城镇化过程中发展的新城区和休耕地。国外采用不同数据源和最大似然法、神经网络、支持向量机法、面向对象法等方法研究建成区的检测方法[10, 11, 12, 13],研究表明利用多个时间系列与季节信息可提高建设用地的分类精度[5, 6]。中国开始出现利用多时相MODIS与NDVI数据分离土地覆盖分型和简单地物提取[14, 15, 16]。但未比较不同数据组合对分类结果的影响,也未引入多时相数据前后的分类精度与不同分类方法进行比较,也未针对分类精度进行分析。本文拟使用49景Landsat TM小样本数据集,研究1990—2010年福州市土地覆盖类型的NDVI多时相轨迹,研究城镇化背景下基于时序TM/NDVI的建成区检测方法,比较不同数据组合和季节对检测新城区的影响,研究添加的变化地物到学习样本对城镇化进程中的新城区检测精度的影响。
福州市位于北纬25°15′~26°49′,东经118°08′~120°31′,城区主要位于其南部,土地覆盖类型以林地为主,耕地较少,全年冬短夏长[17]。自2002年来,福州市政府提出 “东扩南进、沿江向海”的发展策略,城市快速向南部的仓山区、闽侯县和东部的晋安区、马尾方向快速扩张,耕地面积迅速减少。福州市在中国东南沿海城市中具有一定的代表性。
研究数据为1T级Landsat TM数据,经过系统辐射校正和地面控制点几何校正,且通过DEM进行了地形校正。空间分辨率为30 m,数据来源于http://www.gscloud.cn与http://glovis.usgs.gov。图像的大小为2 669×2 668,共7 120 892个像素,覆盖面积达1 600 km2。
研究区土地覆盖类型包括耕地、林地、建设用地和水体、沙滩。其中,建设用地包括所有非植被的人工建筑要素,公园绿化定义为非城区。耕地若一个像元内作物覆盖度超过60%,则认为该像元属于耕地类[6]。参与分类评价的总样本为71 202个像素,平均每个类别的学习样本数为250,测试样本总数为405,分别占比例为0.35%和0.57%。其中耕地91个,林地98个,建设用地93个,水体75个,沙滩48个。
首先,检查研究区所有数据的几何精度,对卫星数据1、2、3、4、5、7波段进行组合和研究区域裁剪。密集时间堆栈TM影像不必进行条带数据修复[6]。采用MODTRAN4+模型进行辐射定标与大气纠正[18]。其次,抽取TM4和TM3波段的表面反射率计算归一化植被指数(NDVI)。将NDVI值不在(-1,+1)的值,其最大值赋值为1,最小赋值为-1,绘制主要土地类型的NDVI多时相轨迹图。接着,借助Google Earth VHR(2013)与多季节的TM数据,选择训练样本进行判读解译,在学习样本中添加耕地发展为建设用地的样本特征。最后,采用最大似然法、面向对象法、支持向量机和神经网络法分别对3种不同组合数据进行分类,并采用分层随机抽样法对分类结果进行评价。
由图 1可见,随着年际与年内的变化,各类型的NDVI具有明显不同的波形特征,幅值和变化趋势。耕地呈现两极化的双峰循环模式,震荡较为明显,有明显的峰值与峰谷,振幅最高,出现震荡的频率较高;建城区随着时间的推移略有变化,振幅小,震荡频率较低;林地随着时间的改变而呈波浪起伏式变化,振幅不大,略高于建设用地,震动频率与耕地相当。
随着时间与季节的变化,耕地发展为建设用地在每个阶段内有着明显时间痕迹,随着城市的扩张耕地发展为建设用地的区域具有唯一的时间趋势(表 2)。根据耕地和建设用地NDVI值的振幅、时间和频率的不同,可以通过时间将二者进行分离。在耕地发展为新城区之前,与耕地NDVI值接近,大体走向与耕地基本一致,呈现耕地两极化的双峰循环特征的时间趋势,但在其发展为新城区后,NDVI值下降,服从建设用地NDVI的时间趋势(图 1)。
得到研究区3种数据组合: TM经大气纠正后的波段(数据1)/ NDVI值(数据2)/TM大气纠正后的波段与NDVI合成数据(数据3)的分类结果。以数据3作为分类的原始数据得到不同方法的分类结果见表 3和图 2。面向对象法的尺度分割参数设置为35;支持向量机采用径向基RBF函数,核参数γ值设为0.048,惩罚参数设为100;神经网络活化函数选择对数,训练贡献阈值设置为0.9,权重调节参数设置为0.2,训练动量参数设置为0.9,训练中误差退出参数设置为0.9,隐藏层参数设置为1。实验表明,面向对象法具有最高的分类精度,达到84.44%,具有最佳的分类效果,而支持向量机的分类精度次之,最大似然法最低。
总体上,面向对象法在各土地类型的综合效果最佳,在各土地覆盖类型都具有较高的精度,且差异较小,其在建设用地分类中具有最高的制图精度和用户精度,见图 3、图 4。
各分类方法在各土地类型的制图精度都比较接近,支持向量机法在建设用地的制图精度仅次于面向对象法(见图 3)。除面向对象法外,其他方法在不同土地类型的用户精度差异较大,最大差异值达40%左右,最大似然法在建设用地的用户精度最低(见图 4)。
通过对多个时段福州市TM影像进行多种数据组合,测试多种分类算法的效果,各分类算法的参数通过多次调试,得到每种方法的最佳参数与最佳分类结果。实验表明,多个年份的分类结果显示,无论是采用以上4种方法的任一种,数据3得到的分类结果都是最佳;以2009年6月的数据为例,使用NDVI数据的分类精度能达75%,与TM原始数据的分类精度略低,不同数据组合的分类精度差值达3.49%。
实验表明,2003年夏季的TM影像的分类精度比其他时段的明显要高,不同时间段的选择对面向对象法分类结果影响最高可达5.22%,见表 5。建设用地和耕地的制图精度和用户精度明显也要比春季与冬季分别高3.68%与5.08%,见表 6。总之,同一年不同季节监测建设用地的难度是不同。在春夏季节较易识别建设用地,而在秋冬季节则比较难区分耕地与建设用地。
以2001—2003年时间段为例,经过大气纠正后的2003年5月TM影像与NDVI合成的数据组合,引入102个耕地发展为建设用地的样点到学习样本,占总学习样本的40%。
结果表明,添加耕地发展为建成区的样点到学习样本中,总体分类精度提高了3.54%,建设用地的制图精度提高了4.24%,见表 7。
首先,以上结果都是建立在图像质量较优的基础上,未讨论数据质量(如局部有少量薄云)对分类方法与分类结果的影响。其次,学习样本中引入耕地发展为建设用地的地物特征只选择了一个时间段分类,未能对福州市主要的几个时间段都进行研究,而且未能深入研究添加地物特征的数量对建设用地的分类结果的影响。最后,各种方法的参数设置对分类结果有一定的影响,主要依靠人工多次实践获取理想参数,在最佳参数选择方面有待进一步改进。
在城镇化背景下基于时序TM/NDVI的建成区检测方法研究,以福州市为例,对于小样本的数据集,面向对象法的分类精度最佳,达到84.44%;不同的数据组合和不同季节对分类精度的最大影响分别达3.49%和5.22%;添加城镇化进程中的变化地物特征到学习样本后,分类的总体精度与福州市新城区的制图精度分别提高3.54%和4.24%。总之,在城镇化背景下基于时序TM/NDVI的建成区检测方法可在一定程度上解决耕地与建设用地的混分问题。