文档

文档 准确性和比较

指标说明

特定站点的卫星数据模型性能由以下指标表征,这些指标是针对每个场地计算得出的,可以与优质地面测量值进行比较:

  • 偏差(Bias)或平均偏差偏差(Mean Bias Deviation, MBD)表示站点的系统模型偏差,即系统性过度或低估。当卫星建模值过高估计时偏差值将高于零,而低估时偏差值将低于零(与地面测量值相比)。
  • 均方根误差(Root Mean Square, RMSD)和平均绝对偏差(Mean Absolure Deviation, MAD)表示瞬时值的误差分布。 RMSD表示短期建模值(小时内、小时、每日、每月)与地面测量值之间的差异。

通常,偏差被认为是模型精度的第一个指标,但是应该在分析所有测量值的情况下对模型精度进行解释。虽然了解偏差有助于理解长期估计的可能误差,但MAD和RMSD对于估算能量模拟和运行计算(监测、预报)的准确性非常重要。通常将验证统计量归一化并以百分比表示(例如,rMBD用于相对平均偏差偏差)。

我们也可以计算其他指标,如Kolmogorov-Smirnoff指数(KSI),它表示了数值分布的代表性。它可能表明模型能够代表各种太阳辐射条件的问题。 KSI对于精确的聚光式太阳能(CSP)建模非常重要,因为这些系统的测量数据与辐照度水平是非线性的。即使不同的卫星数据模型的偏差相似,其他精度特征(RMSD, MAD和KSI)也可能表明其性能存在显着差异。

概观

通过比较Solargis在所有类型气候的200多个地点的优质地面测量值来校准建模数据后,观察到以下情况:

  • 80%站点的GHI偏差在±3.1%之间,而DNI偏差则是在±6.8%之间
  • 90%站点的GHI偏差在±4.6%之间,而DNI偏差则是在±9.0%之间
  • 98%站点的GHI偏差在±7.1%之间,而DNI偏差则是在±11.8%之间

对不同地理位置和情况的偏差分布进行分析,可以得出以下结论(下表摘要):

  • 在大多数情况下,对于GHI值,年度值的预期偏差将在±4%之内,对于DNI值,预期偏差为±8%:
    • 欧洲和北美大部分地区(约纬度50°以下)和日本
    • 地中海地区、阿拉伯半岛(海湾地区除外)和摩洛哥
    • 南非、智利、巴西、澳大利亚
    • 具有高质量地面测量的区域
  • 以下地方对于GHI值,预期偏差可能高达±8%,对于DNI值,预期偏差可能高达±12%:
    • 高纬度(约纬度50°以上)
    • 热带气候潮湿的国家(例如非洲、美洲和太平洋、菲律宾、印度尼西亚和马来西亚的赤道地区)和沿海地区(距水约15公里)
    • 大气粒子浓度高且动态变化的地区(印度北部、西非、海湾地区、中国部分地区)
    • 高山地区有定期的冰雪覆盖和高反射率的沙漠
    • 有限或无法获得高质量地面测量的区域

Solargis的数据验证工作,通过分析当地气候和地理特征之后查看模型性能,可以逐个地得出位置特定的不确定性估计。

请在下表中找到Solargis数据库的太阳辐射数据的准确性摘要。PDF 文档(1.5 MB)中有更详细说明和公开验证统计信息。

可参考另一份出版物,有关不确定性和验证来源的更多信息,请参阅本科学手册的2.8和2.9节。

             

 

GHI

DNI

描述

验证的站点数量

208

143

-

公共站点数量

163

102

-

所有站点的平均偏差

0%

-1.7%

平均高估和低估测量值

标准差

±2.9%

±5.8%

验证站点的模型估计偏差范围的指标

验证站点外的预期偏差范围(P90不确定性)

±4% to ±8%

±8% to ±12%

取决于对地理和地面测量可用性的具体分析

偏差分布的表征

如果我们想要描述验证站点之外的站点的偏差,我们可以采用简化假设,即模型与模型估计的测量值之间存在正态偏差分布(normal distribution of deviations)。在描述正态分布曲线时,可以观察到以下事实:

  • 偏差(bias)的平均值接近于零。这意味着没有系统化的趋势,要么高估要么低估(以中心为对称分布)。
  • 偏差(bias)的标准差(standard deviation)相对较低。由窄概率分布表示,即P90值(在90%的情况下超过的值)将更接近P50(最期望值)。

与任何其他测量方法一样,用户不能期望基于卫星的太阳能建模具有零不确定性。然而,如果正确执行演算法,则可以预期模型对于地理条件进行稳健且均匀的计算,此已被校准和验证。

尽管验证站点的分布是不规则的,但在各个气候区域内可以观察到Solargis的建模是稳定且可预测的。有关公开可用的验证站点和统计信息的完整列表可以在本PDF文档的附件中找到(1.8 MB)。

对于实际应用,必须将精确度的统计度量转换为不确定性,这更好地表征了模型估计可能的误差的概率性质。评估不确定性的其中一种方法是利用置信区间(confidance interval)来估计其概率性质。当假设正态分布(normal distribution)时,统计上,一个标准差(standard deviation, STDEV)的发生概率(probability of occurrence)为68%。利用标准差,我们可以构建其他置信区间:

 

发生概率

公式

一个标准差

68.3%

± STDEV

两个标准偏差

95.5%

± 2*STDEV

三个标准偏差

99.7%

± 3*STDEV

P75 不确定性

50%

± 0.675*STDEV

P90 不确定性

80%

± 1.282*STDEV

P95 不确定性

90%

± 1.645*STDEV

P97.5 不确定性

95%

± 1.960*STDEV

P99 不确定性

98%

± 2.326*STDEV

 

从置信区间我们可以计算出不同的概率场景.P50值将是期望值(概率密度曲线的中心),由此可以表达各种置信水平。例如,在太阳能资源评估中,P90值已成为标准,它代表了90%的情况下,超乎估计的数字。

 

超出的可能性

不超出的可能性

公式

P50 值

50%

50%

Mean

P75 值

75%

25%

Mean - 0.675*STDEV

P90 值

90%

10%

Mean - 1.282*STDEV

P95 值

95%

5%

Mean - 1.645*STDEV

P97.5 值

97.5%

2.5%

Mean - 1.960*STDEV

P99 值

99%

1%

Mean - 2.326*STDEV

 

 

 

验证站点的代表性

即使在给定地理条件下,我们也不能够只以一个站点的验证统计数据来代表模型性能。个别站点可能受到当地区域性气候或地面测量数据中的隐藏问题的影响。

因此,需要足够数量的验证点来评估建模计算长期年度GHI和DNI值的能力。良好的卫星模型在空间和时间上是一致的,因此在同一个地理区域内进行几个站点验证,方能在地理可比区域提供模型准确性的可靠指示。

截至目前,Solargis模型已在全球200多个站点得到验证。尽管参考站点的数量随着时间的推移而增加,但是高质量的地面测量在某些区域仍是有限的。在这种情况下,如果特定地理区域内的许多验证站点显示偏差并且RMSD始终在一定值范围内,则可以假设该模型在具有相似地理位置且无法获得验证站点的区域中也将表现一致。

只要使用高精度仪器收集大部分的验证数据,并应用最佳测量实践和严格的质量控制,就可以计算模型的准确性。

GHI公开验证站点地图

GHI validation 16 9 2019
  • rMBD less than -4
  • rMBD from -4 to -2.5
  • rMBD between -2.5 and 2.5
  • rMBD from 2.5 to 4
  • rMBD more than 4

DNI公开验证站点地图

DNI validation 16 9 2019
  • rMBD less than -8
  • rMBD from -8 to -5
  • rMBD between -5 and 5
  • rMBD from 5 to 8
  • rMBD more than 8