我们研发第一次看到这个题目的时候,首先问出了一个问题
为什么要预测山西全省发电
--先说Why,再说How--
这个问题可以拆分成两个小问题,一个是为什么要预测,问一问发电站不就知道了?第二是为什么是全省,还特别是山西
看一看这两个小问题,第一是为什么要预测,在卫星AI技术如何更好帮助风光发电摆脱看天吃饭已经提到,之所以要预测,因为新能源发电是不可控的,是看天吃饭的,大风起兮,风电就能开心的发电;万里无云,光伏站就能开心的发电;而地球天气系统的复杂性,混沌性和不可预测性,都让新能源发电高度不可控。
所以你去问发电站未来若干天的发电量,他们大概率也是不确定的。
山西持续增加电力市场交易规模(新华社)
第二为什么是山西,其实也可以是山东;任何新能源占比比较高的地方,开放了电力市场现货交易的地方,都是需要去预测新能源发电的地方。原因很简单,以山西为例,因为新能源占比高,电价的波动主要来自于新能源发电的波动,而新能源发电的波动,当然主要就来自于天气的波动了。
虽然说道理是这么个道理,但技术问题就来了,如何预测呢?
--大象放进冰箱分几步--
在上一期技术文章里,我们分享了一些技术如何可以帮助单个电站缓解看天吃饭的问题,但这里我们在讨论的是整个山西省,这问题的尺度就完全不一样了。
研发说:小事情啊,先给每一个电站训个预测模型,然后再一加,那不就是全省发电了么
那么,所以。需要至少先知道电站都在哪吧。好在这个信息都是公开信息,比方说,
环球时报报道
当然,用卫星AI的方式去识别每一个光伏板和风机,也是非常必要的事情了,这样可以确保数据的精确性,这是一个卫星影像上的目标识别问题,比如说这样的效果
我们就可以得到这样的风机分布图
再比如说光伏板

事实上,光伏板的识别是一个比风机更有挑战一些的问题(想不到吧),因为风机毕竟目标比较大,特征也足够显著;而光伏板就不一样了,特别是分布式光伏,经常和屋顶有混淆,需要训练若干次模型迭代。毕竟这个对精度的要求还是很高的。
OK,现在我们知道光伏板和风电站的具体位置了,那么就可以开始跑AI模型了。
--炒一份菜 vs 构建炒菜工厂--
虽然我们可以给每一个发电站建一个模型,最后加起来,但发电站实在太多了,这是一个非常严肃的工程问题。举个例子,你家来了一个客人,你为他做一餐,一个白菜要炝炒要清炒还是要炖汤,都无所谓,怎么高兴怎么来。
但是你家突然变成「每天都会来几万个客人」的时候,事情就完全不一样了,你得考虑建一个炒白菜的工厂才行了,这就从「炒一个好菜」这个算法问题,演化到了「炒五万份好菜,并确保品质一致,并且确保长期品质一致」的算法工程问题了。
(当然,找他五万个厨师来理论上也不是绝对不行)
那么跑预测模型也一样,每个地方的气象条件显然是不一样的,甚至望京SOHO的38层和1层的风速都是不一样的,我们需要给每一个地方建一个模型,并且中心化的管理他们。
这个就要搞大规模分布式并行训练了,并且是在GPU上。说到这个就想起了正好我们去年就做了一个事情,如何在一个月内提取全中国所有建筑。
从个人来讲,AI三驾马车,算法,算力,数据,其中算力是最重要的,这是任何大模型背后的并不通常在聚光灯下的基础支撑。OpenAI训练GPT一次可以调动两万多张A100,除了真的贼有钱之外,也是创始人Greg Brockman的一项壮举。
给我一口锅我一次能炒一份菜,给我五万口锅,我好像一次也只能炒一份菜
小编自己心想
所以大规模的训练,在既要又要还要的思想下,我们需要实现既要品质一致,又要计算资源最大化利用,还要训得合理的快(不能训到地老天荒)。
研发说:那不就是我司的OceanStorm系统么,对,上图就是OceanStorm系统的概念图,中间那个是波塞冬
--应对装机增长与气候变化--
是,我们是可以一次调度数百张GPU,但,跑完模型就完了么?Nonono,还需要应对快速增长的装机容量。
以我国基建狂目前新能源的建设速度,恐怕上个月的模型在这个月都不能用了。小编既为我国新能源发电的高速发展感到兴奋,又为这种变化可能会带来的预测模型不稳定性感到焦绿怎么办?
销售说:这个问题,让研发每天重新训一下不就好了吗研发说:你以为我每天是一杯茶,一包烟,一个模型跑一天?HR说:这样好像工作不太饱和吧  研发又说:算了算了,咱们这个模型是个成熟的AI了,懂得自己训自己了  模型说:。。。。。。
我们确实可以让模型自己训自己,毕竟人家GPT的RLHF也是需要一边推,一边训的,这就是我们所谓的「在线学习」,每一天的全省预测,和每一天的全省实发,都可以每一天重新出一个新模型。
毕竟只要大规模计算调度做得好,更新个模型就跟炒五万份白菜一样轻松,你说是不是。
模型的自训练与演化
最后就是应对气候变化带来的影响了,毕竟全省这种尺度和单个发电站还是不一样的,就好像你家里的气温,开个空调就可以轻松控制,气候变化对你来讲可以是无感知的;但全球的气温就不一样了,就不得不考虑气候变化了。
除了定期重新训练预测模型之外,最重要的就是如何正确的预测天气了,特别是在极端天气下;这就是AI气象大模型了。等小编下次有空,再好好写一篇技术文章深入介绍它。
不过,回到题目,如何预测山西的全省发电,研发同事告诉小编的答案是
「就跟把大象放进冰箱一样简单,总共4步」
    • 先知道风光电站都在哪

    • 搞个几十台A100的机器
    • 整个时序或者图像大模型,最好长期能自己训自己
    • 部署上线,欧了
但是作为负责任的小编,写文章不能几句话这么草率。就像我司预测技术实际细节也必然不是这研发同学说得这么简单,期待你来试用哦。

戳下方图片,跳转对应推文
继续阅读
阅读原文