太阳能是一种无污染的清洁能源,中国幅员辽阔,气象条件复杂,不同气候之间差异明显,太阳能资源非常丰富。如果能对这部分能量准确估算并加以利用,对于建筑节能、环境保护和提高室内环境的舒适性都有积极意义。完整准确的太阳辐射数据是利用太阳能的前提,而目前由于经费、设备维护等方面的原因,使得太阳辐射观测数据远远不能满足需求。以中国为例,辐射台站的数量远少于气象台站,仅有120余个,不及基本地面气象观测站数量的4%。辐射数据的匮乏严重制约了低能耗建筑设计的发展,如何准确估算无实测数据地区的太阳辐射量,实现辐射数据从无到有,是目前建筑节能设计中迫切要解决的基础性问题。
对于太阳辐射资源的计算,目前普遍应用的研究方法主要包括:1)空间插值法。利用地统计学中的空间插值技术和基于地形因子的统计方法,产生栅格化的太阳辐射空间分布数据,实现方式有所不同,可以对太阳辐射数据直接插值[1-3],也可以对辐射估算模型系数或自变量插值,从而间接计算出太阳辐射量[4-6];2)卫星反演法。利用卫星遥感技术,从观测信号中提取能较好反映地表太阳辐射的信息,结合地形、气象要素的影响,完成地表太阳辐射的反演计算,从而弥补地面太阳辐射观测数据的不足[7-8]。空间插值法克服了一般内插法不能充分考虑气象要素空间分布的不足,但由于辐射资料站点数量过少影响了数据精度;采用遥感手段反演地表参数,由于其技术本身的复杂性,也存在较大的不确定性,加之中国西部尤其是青藏高原地区常用的高空间分辨率的数据资料(如MODIS)比较稀少,因此,仍需要在地面观测的基础上利用其他计算方法所得结果作为补充,应用具有一定局限性[9]。综上所述,有必要提出一种算法简单、能在中国推广应用且满足误差要求的太阳辐射资源计算方法。
采用气候学的方法计算到达地面的太阳辐射具有物理意义明确、计算简单、利于推广等优点,是迄今为止最成熟,应用最广泛的方法,尤其是其中的经验模型法使用日照百分率、日较差、云量等常规气象观测资料建立了辐射经验估算模式,使更多地区估算太阳辐射量成为可能。中国气象局在全国共建有地面气象观测站2 400多个,为模型法的实现提供了数据基础,且台站覆盖了人口密集的所有城镇地区,完全能满足建筑热环境研究的需求,于是,如何确定经验模型系数成为估算该地区太阳辐射量的关键。笔者提出基于太阳辐射区域化的经验模型系数确定方法,通过两级区划指标,将太阳辐射气候相似的地区划分为一个辐射区域,每个区域中包含了同时具有气象和太阳辐射观测数据的少量台站以及仅有气象观测数据的大量台站,利用少量台站的观测数据生成模型系数,该系数即作为区域模型系数,用于该区域中其他台站的太阳辐射量的计算。
太阳辐射区域化研究最早由Terjung[10]提出,随后各国学者陆续进行相关研究,研究方法主要分为两类:一类是延续Terjung的思路,使用太阳辐射数据本身作为分区依据,根据经验提出辐射临界点,将两个临界点之间的地区划分成一个区域[11-12];另一类是以晴空指数或晴空指数与地理参数(如纬度和海拔)相结合作为分区依据,使用聚类方法进行区域划分[13-14]。参与分区的台站数量和太阳辐射数据质量直接决定着分区的可靠性与准确性,理论上用于分区的台站数量越多且使用近20~30年辐射数据得到的结果就越可靠。而目前中国具有太阳辐射日值观测数据记录的台站数量有限,且记录年限长短不一,所以,无论是直接使用太阳辐射数据本身,还是在太阳辐射基础上通过二次计算得到的数据(例如:晴空指数)作为分区指标,都会出现参与分区台站数量少、太阳辐射数据不足的问题,从而影响分区结果。于是,需要建立新的分区指标,既能反映太阳辐射的变化又能克服台站数量不足对于分区精度的影响。
区域化目的要求分区相对精细但数量也不宜过多,否则会使得区域内缺乏足够的数据确定模型系数,从而影响辐射量估算精度;区域化指标选择原则要求既能体现太阳辐射的变化又能克服辐射数据本身数量不足对分区结果的影响。鉴于以上要求,提出太阳辐射两级区划方法,每一级选择不同的区划指标,通过一级区划实现对中国太阳辐射气候的粗略划分,再在每一个一级划分区域中通过二级区划进一步细化,由“粗”及“细”,得到太阳辐射气候区化结果。
晴空指数Kt定义为入射到水平面的太阳总辐射与天文辐射之比,如式(1)。太阳辐射进入大气后受云、大气分子、臭氧、二氧化碳、水汽、气溶胶等各种成分的吸收、反射等作用而减弱,在不同大气条件下太阳辐射受到大气影响的程度不同。晴空指数是描述大气对太阳短波辐射影响的一个综合参数,是衡量空气透明度的指标,综合反映了太阳辐射在穿过大气层时受到的衰减,特别适合描述建筑对太阳辐射强度的要求。Kt低意味着总辐射量小,通常代表多云天气且总辐射以散射辐射为主;Kt高意味着太阳总辐射量大且以直射辐射为主。所以晴空指数与总辐射量息息相关,可以作为太阳总辐射区域化指标,而且使用晴空指数代替总辐射作为分区指标还有助于抑制受纬度影响的天文总辐射变化带来的地面总辐射变化。
式中
式中:G为水平面日总辐射曝辐量,MJ/m2;G0为天文日总辐射曝辐量,MJ/m2;ISC为太阳常数,取4.921 MJ/m2;$\phi $为纬度;δ为太阳倾斜角;ωs为日落时角,ωs=cos-1(-tan$\phi $tan δ);E0为地球轨道的离心率修正因子。
到达地面的太阳辐射除了受天文因子(包括太阳常数、日地距离、太阳高度角等)、地理因子(包括观测点的纬度、海拔、地形等)的影响外,还受地球大气层的强烈影响,而气象要素(包括温度、相对湿度、气压、风、云量等)对大气层的构成起决定作用,所以,气象要素与太阳辐射之间有密切联系。目前提出的太阳总辐射预测模型大多都是借助不同的气象要素来估算太阳辐射量,例如,基于云量的Badescu模型[15]、基于温度的Hargreaves模型[16]、基于日照时数和相对湿度的Angstrom-Prescott(AP)模型[17]等,充分说明了气象要素对太阳辐射的影响。笔者选择中国同时具有日总辐射与其他气象要素实测数据的120个台站,借助SPSS工具计算每个台站日照时数、日平均气温、气压、风速、相对湿度及日较差相对于日总辐射量的偏相关系数,如图 1、图 2所示。从图中可看出,日照时数、日平均温度与日总辐射量的相关性较其他气象要素更强。但这两个气象要素是否与日总辐射量信息重叠程度高、是否可替代其做为分区指标尚需证明。在统计学中,某个单指标与其他多个指标的信息重叠一般可用复相关系数来反映,复相关系数越接近1,则他们之间的信息重叠程度越严重,越接近于零,则信息重叠程度越低。计算上述120个台站日照时数、日平均温度与日总辐射量的复相关系数,称为第1组;为了便于比较,又计算了除以上2个气象要素外的其他4个要素(气压、风速、相对湿度及日较差)与日总辐射量的复相关系数,称为第2组,统计第1、2组复相关系数分布,如图 3所示。图中第1组复相关系数大于0.8,第2组复相关系数明显小于第1组,多数分布在0.5~0.8之间,由此可知,日照时数、日平均温度与日总辐射量的信息重叠程度远高于其他要素,具有替代日总辐射量的能力。加之目前具有近30 a日照时数和日平均温度实测数据的气象台站达900多个,数据充足,有效弥补了由于辐射观测站数量有限而造成一级区域划分过粗的不足。由此可见,可选择日照时数和日平均气温作为二级区划指标。
太阳辐射气候区域化的难点在于利用有限的、在地理上分散的台站数据划分出若干个区域范围,这是在大数据中通过寻找数据间的相似性进行分类的问题,处理该类问题常用的方法是聚类。近年来, 中国应用聚类方法对不同气象因素进行分区的研究也见诸报道,例如:文献[18-19]分别利用分层聚类方法对中国不同时间尺度的平均气温和降水量进行区划;文献[20]对比了快速样本聚类法、分层聚类法及聚类统计检验法在中国温度区域化中的应用,论证了3种方法各自的优势。通过分析文献发现,分层聚类法在气象要素区域化中应用最为广泛,尤其是其中的离差平方和(Ward)算法在数学上有更多的优势,得到的样本聚类结果对比度最好[21]。基于此,选择分层聚类方法,具体应用Ward算法,根据一级和二级分区指标逐级对中国太阳辐射气候进行区划,在计算样本之间的距离时选择平方欧式(Euclidean)距离。
文献[5]中选择中国具有日总辐射实测数据的123个台站,数据记录时间在1957—2000年之间,记录时间从10~44 a不等,分别计算各台站累年逐月平均晴空指数,可得到一个123×13矩阵,矩阵的第1列是台站号,后12列分别是1月到12月累年月平均晴空指数值。借助SPSS工具完成聚类,根据Ward算法原理,当两类归并为一个新类时离差平方和会增加,如果分类正确,则离差平方和增加较小,反之如果将本来不属于同一类的样本强行归为一类则离差平方和会突然增大。如将类与类合并时所产生的离差平方和表示成一条曲线,则曲线拐点处所对应的类数将为样本的最佳分类数。SPSS的结果页面可以显示每次归并所产生的离差平方和数据,发现当类数从5降到4时离差平方和突然增大,可见离差平方和曲线拐点对应的类数为5。于是通过一级区划可将中国太阳能气候划分为5个区域,边界线根据所属不同区域最近的两个台站之间的地理距离中点划定,一级区划结果如图 4所示。
区域1西起青藏高原东至内蒙古高原,是中国太阳辐射最丰富的地区;区域4主要以平原地形为主,分布在东南沿海一带,包括华中、华南平原;区域5主要分布在四川盆地中部,西临青藏高原、南临云贵高原、东临巫山山脉、北临大巴山区,特殊的地形使得该区域终年多雾,年平均晴空指数在全国最低;区域2和区域3都包含两个地理上被隔离开的区域,为了方便说明,文中以2A、2B、3A、3B区分,2A区域包括塔里木盆地和吐鲁番盆地,2B区域主要以高原为主,南起青藏高原,经黄土高原和内蒙古高原,东至大兴安岭山脉;3A和3B区域分别覆盖了东北、华北平原和云贵高原。结合区域的地理分布,一级区划实际上是将中国划分成7个太阳辐射气候区域。
从中国气象日值数据集的905个台站中选择具有1984-01-01—2013-12-31数据记录连续超过20 a的台站,共计646个。将这些台站按照经纬度归入一次划分的区域中,计算各台站日照时数和平均温度的累年月均值。以区域4为例,该区域中包含187个台站,于是可以得到一个187×25矩阵,矩阵的第1列是台站号,后24列分别是一月到十二月累年月平均日照时数和温度值。为了消除变量之间由于量纲不同带来的离差平方和差异,首先要进行数据归一化处理,然后再利用SPSS工具聚类。与一次聚类步骤相同,将类与类逐次归并时所产生的离差平方和以曲线表示,该曲线称为肘标准曲线,如图 5所示。从图 5可以看出,当由3类减少到2类时曲线出现拐点,由此可见,将区域4二次划分成3类最合适。按照上述步骤依次将7个一级区域逐一进行二次划分,共得到17个二级区域(见图 6),图中较细的曲线为二级区划边界线。表 1中统计了每个二级区域的平均海拔并分析区域地形特征。
实现总辐射量准确估算有两个重要环节:其一是选择适当的模型形式;其二是确定合理的模型系数,在模型形式确定后,模型系数对推算精度起决定作用,其确定方法成为了准确生成日总辐射数据的关键。提出基于辐射区域化的模型系数确定方法,根据辐射分区结果,利用各区域内同时具有太阳辐射与气象实测数据的台站回归得到模型系数,将该系数用于本区域内其他台站太阳辐射量估算中。以陕西省为例,该省气象台站共36个,辐射台站仅有3个——西安、延安、安康,辐射数据实测状况见表 2(数据来源于国家气象信息中心),借助该方法确定模型系数,计算其余33个台站的日总辐射量。由于生成的辐射数据主要用于建筑热环境分析,所以, 太阳总辐射量的估算要精确到日尺度。
基于日照时数的太阳总辐射预测模型最早是1924年由Angstrom提出,该模型揭示了同一地区日总辐射和相应的晴天日总辐射的比值与日照时数和最大可能日照时数比值之间的线性关系。1940年Prescott对此模型作了修正,习惯称为Angstrom-Prescott(AP)模型[17]。该修正模型用天文日总辐射代替了晴天总辐射,更加便于应用,见式(3)。其中:S为日照时数; S0为最大可能日照时数; a、b为回归系数; G0和S0可通过式(2)、式(4)计算得到。AP模型结构简单易于计算,并且在大多数气候条件下都能获得较好的结果,是目前应用最广泛的太阳总辐射计算模型,选择其作为估算模型。
为了检验估算数据对实测数据的代表性及二者的差异,引入两个误差评价指标,分别为均方根误差(RMSE)和决定系数R2,定义为
RMSE代表数据在回归曲线周围的分散程度;R2值在0~1之间,R2越接近于1则回归模型与实测数据的拟合程度越高。
在二级区划结果中陕西省分属于2B-1、3A-1、3A-2和4-1区,选择各区域中同时具有辐射和气象数据台站1980年后的数据回归得到模型系数a、b,计算模型与观测数据的拟合程度,见表 3,R2最低为0.724,说明模型能够较好地反映出实际数据之间的关系。从每个区域内任意挑选一个台站作为模型验证,该台站须具有日总辐射实测数据但并未参与建模,误差分析结果见表 4。结果显示在太阳辐射资源丰富、平均晴空指数较大的2B-1区域模型计算误差最小,后随平均晴空指数的减小而逐渐增大,在平均晴空指数较低的4-1区域计算误差最大,达到17.11%。总体来看,RMSE的平均值处于15%以内,可以满足误差要求。
利用表 3的模型系数,结合日照时数观测数据,可计算出其余33个台站(表 5)1980年以后的日总辐射量,并进一步计算出各台站累年平均日总辐射量,借助GIS工具插值可得陕西省日总辐射分布图,见图 7。图中累年平均日总辐射量由陕北、关中至陕南逐渐减小,陕北太阳辐射资源丰富,累年平均日总辐射量大于12 MJ/m2,其中,陕北北部长城沿线尤其突出,累年平均日总辐射量超过15 MJ/m2;关中地区累年平均日总辐射量处于12~13.5 MJ/m2之间,华山由于海拔较高,累年平均日总辐射量高于关中其他地区;陕南地处秦岭以南,气候状况与巴蜀相近,太阳辐射资源相对薄弱,累年平均日总辐射量在10~12 MJ/m2之间。
太阳辐射气候区域化是太阳能资源优化配置与高效利用的重要环节,在建筑、农业和气象等领域均有重要意义。针对建筑热环境设计中太阳辐射数据不足的现状,采用两级区划方法对中国太阳辐射气候进行划分:一级区划指标为晴空指数;二级区划指标为日照时数和平均温度,得到17个太阳辐射气候区域。在分区基础上提出了经验模型系数的确定方法,计算出无辐射观测数据台站的日总辐射量,可实现中国96%的气象台站辐射数据的从无到有。以陕西省为例计算出省内33个台站累年平均日总辐射量,其数值具有从北向南递减趋势,即太阳辐射强度由陕北长城沿线、陕北中部、关中、陕南逐渐减弱,该结果与纬度、气候和地形对太阳辐射强度的影响机理相符,并与文献[22-24]中得到的太阳辐射分布完全一致,表明太阳辐射两级区化方法可以用于日总辐射量计算中。