文档

文档 准确性和比较

概观

通过比较Solargis在所有类型气候的220多个地点的优质地面测量值来校准建模数据后,观察到以下情况: 

 

GHI

DNI

描述

验证的站点数量

228

166

-

所有站点的平均偏差

0.3%

2.2%

平均高估和低估测量值

标准差

±3.0%

±5.3%

验证站点的模型估计偏差范围的指标

验证站点外的预期偏差范围(P90不确定性)

±4%~±8%

±9%~±14%

取决于对地理和地面测量可用性的具体分析

Solargis的数据验证工作,通过分析当地气候和地理特征之后查看模型性能,可以逐个得出特定位置的不确定性估计。PDF 文档(1.7 MB)中有更详细说明和公开验证统计信息。

GHI公开验证站点地图

GHI 17 8 2020
  • rMBD less than -4
  • rMBD from -4 to -2.5
  • rMBD between -2.5 and 2.5
  • rMBD from 2.5 to 4
  • rMBD more than 4

DNI公开验证站点地图

DNI 17 8 2020
  • rMBD less than -8
  • rMBD from -8 to -5
  • rMBD between -5 and 5
  • rMBD from 5 to 8
  • rMBD more than 8

偏差分布的简化表征

如果我们想要描述验证站点之外的站点的偏差,我们可以采用简化假设,即模型与模型估计的测量值之间存在正态偏差分布(normal distribution of deviations)。在描述正态分布曲线时,可以观察到以下事实:

  • 偏差(bias)的平均值接近于零。这意味着没有系统化的趋势,要么高估要么低估(以中心为对称分布)。
  • 偏差(bias)的标准差(standard deviation)相对较低。由窄概率分布表示,即P90值(在90%的情况下超过的值)将更接近P50(最期望值)。

与任何其他测量方法一样,用户不能期望基于卫星的太阳能建模具有零不确定性。然而,如果正确执行演算法,则可以预期模型对于地理条件进行稳健且均匀的计算,此已被校准和验证。

指标说明

特定站点的卫星数据模型性能由以下指标表征,这些指标是针对每个场地计算得出的,可以与优质地面测量值进行比较:

  • 偏差(Bias)或平均偏差偏差(Mean Bias Deviation, MBD)表示站点的系统模型偏差,即系统性过度或低估。当卫星建模值过高估计时偏差值将高于零,而低估时偏差值将低于零(与地面测量值相比)。
  • 均方根误差(Root Mean Square, RMSD)和平均绝对偏差(Mean Absolure Deviation, MAD)表示瞬时值的误差分布。 RMSD表示短期建模值(小时内、小时、每日、每月)与地面测量值之间的差异。

通常,偏差被认为是模型精度的第一个指标,但是应该在分析所有测量值的情况下对模型精度进行解释。虽然了解偏差有助于理解长期估计的可能误差,但MAD和RMSD对于估算能量模拟和运行计算(监测、预报)的准确性非常重要。通常将验证统计量归一化并以百分比表示(例如,rMBD用于相对平均偏差偏差)。

我们也可以计算其他指标,如Kolmogorov-Smirnoff指数(KSI),它表示了数值分布的代表性。它可能表明模型能够代表各种太阳辐射条件的问题。 KSI对于精确的聚光式太阳能(CSP)建模非常重要,因为这些系统的测量数据与辐照度水平是非线性的。即使不同的卫星数据模型的偏差相似,其他精度特征(RMSD, MAD和KSI)也可能表明其性能存在显着差异。

验证站点的代表性

即使在给定地理条件下,我们也不能够只以一个站点的验证统计数据来代表模型性能。个别站点可能受到当地区域性气候或地面测量数据中的隐藏问题的影响。

因此,需要足够数量的验证点来评估建模计算长期年度GHI和DNI值的能力。良好的卫星模型在空间和时间上是一致的,因此在同一个地理区域内进行几个站点验证,方能在地理可比区域提供模型准确性的可靠指示。

截至目前,Solargis模型已在全球200多个站点得到验证。尽管参考站点的数量随着时间的推移而增加,但是高质量的地面测量在某些区域仍是有限的。在这种情况下,如果特定地理区域内的许多验证站点显示偏差并且RMSD始终在一定值范围内,则可以假设该模型在具有相似地理位置且无法获得验证站点的区域中也将表现一致。

只要使用高精度仪器收集大部分的验证数据,并应用最佳测量实践和严格的质量控制,就可以计算模型的准确性。

Solargis模型的不确定性范围

对不同地理位置和情况的偏差分布进行分析,可以得出以下结论:

  • 在大多数情况下,对于GHI值,年度值的预期偏差将在±4%之内,对于DNI值,预期偏差为±8%:
    • 欧洲和北美大部分地区(约纬度50°以下)和日本
    • 地中海地区、阿拉伯半岛(海湾地区除外)和摩洛哥
    • 南非、智利、巴西、澳大利亚
    • 具有高质量地面测量的区域
  • 以下地方对于GHI值,预期偏差可能高达±8%,对于DNI值,预期偏差可能高达±12%:
    • 高纬度(约纬度50°以上)
    • 热带气候潮湿的国家(例如非洲、美洲和太平洋、菲律宾、印度尼西亚和马来西亚的赤道地区)和沿海地区(距水约15公里)
    • 大气粒子浓度高且动态变化的地区(印度北部、西非、海湾地区、中国部分地区)
    • 高山地区有定期的冰雪覆盖和高反射率的沙漠
    • 有限或无法获得高质量地面测量的区域

基于Solargis数据的验证,可以通过分析当地气候和地理特征,查看模型性能导出特定位置的不确定性估计。更多信息,请参见《Solargis验证报告》(PDF,1.7 MB)第5章以及本科学书籍的2.8和2.9节。

置信区间的计算

当采用正态分布时,统计上一个标准偏差表示发生概率为68% 根据标准偏差,可以构建其他置信区间:

 

发生概率

       公式

一个标准差

68.3%

± STDEV

两个标准偏差

95.5%

± 2*STDEV

三个标准偏差

99.7%

± 3*STDEV

P75 不确定性

50%

± 0.675*STDEV

P90 不确定性

80%

± 1.282*STDEV

P95 不确定性

90%

± 1.645*STDEV

P97.5 不确定性

95%

± 1.960*STDEV

P99 不确定性

98%

± 2.326*STDEV

根据置信区间,我们可以计算不同的概率。 P50值是最高期望值(概率密度曲线的中心),从中可以表示各种置信度。 例如,在太阳能评估中,P90值已成为标准,它代表90%的情况下将超过的数值。

 

  超出的可能性

  不超出的可能性

        公式

P50

50%

50%

Mean

P75

75%

25%

Mean - 0.675*STDEV

P90

90%

10%

Mean - 1.282*STDEV

P95

95%

5%

Mean - 1.645*STDEV

P97.5

97.5%

2.5%

Mean - 1.960*STDEV

P99

99%

1%

Mean - 2.326*STDEV