Objavljeno: 30.1.2024 | Avtor: Matej Huš | Monitor Februar 2024

Napovejmo vreme!

Nekoliko dlje od oči javnosti se je umetna inteligenca prikradla tudi v superračunalnike, ki napovedujejo vreme. Svoje modele razvijajo tako tehnološki giganti kakor meteorološke agencije. V običajnih razmerah so že danes primerljivo zanesljivi kakor klasični modeli in za več velikostnih redov hitrejši. Specializirani modeli, kakršen je slovenska HIDRA za napovedovanje gladine morje, pa so klasične modele že pustili za seboj.

Superračunalnik v Bologni, na katerem ECMWF poganja modele za srednjeročne napovedi vremena.

V pregledu aplikacij za napovedovanje vremena, ki smo ga objavili oktobra lani (Vreme na telefonih, Monitor 10/23), smo zgolj v nekaj odstavkih omenili prihod umetne inteligence. Poleg klasičnih fizikalnih modelov vse več podjetij in meteoroloških agencij preizkuša tudi nevronske mreže in sorodne pristope za napovedovanje vremena. Fizikalni modeli so že zelo natančni, a so računsko zahtevni, kar omejuje njihovo časovno in prostorsko ločljivost ter tudi to, kako pogosto jih lahko poganjajo. Nevronske mreže obljubljajo hitrejši napovedi, ki bi zato lahko bile pogostejše, s tem pa bolj ažurne. Prednosti pa je še več.

Pred 52 leti je Edward Lorenz postavil znamenito vprašanje, ali lahko prhutaj metulja v Braziliji sproži tornado v Teksasu. S tem seveda ni želel trditi, da ga lahko metulj povzroči, saj je nekaj džulov kinetične energije seveda premalo. Lorenz je želel pokazati, da je vreme kaotičen sistem, kjer imajo lahke majhne spremembe v začetnih pogojih velike vplive na končni rezultat. Isaac Newton, Pierre-Simon Laplace in drugi velikani klasične fizike so trdili, da je narava mehanični sistem, kjer ni prostora za nepredvidljivost. Nesposobnost napovedovanja prihodnjega razvoja naj bi izvirala zgolj iz našega nepoznavanja začetnega stanja z zadostno natančnostjo.

Lorenzeva trditev v resnici ni v nasprotju s takim glediščem, temveč zgolj preizprašuje meje natančnosti. Ker ne poznamo hitrosti in položaja vsakega delca v atmosferi, imamo vedno opraviti z nenatančnostjo vhodnih podatkov. Vprašanje je torej, kaj lahko iz njih naredimo in ali nam lahko umetna inteligenca pri tem pomaga. Medtem ko so dolgoročne napovedi obremenjene z velikansko negotovostjo – in o vremenu čez eno leto ne moremo povedati nič –, je kratkoročno vreme sorazmerno pohlevno. Ne glede na prhutanje metuljev lahko že danes z visoko stopnjo natančnosti napovemo, kakšno bo vreme naslednji dan.

A ni bilo vedno tako. Današnje petdnevne napovedi so približno tako natančne kot enodnevne napovedi leta 1980. Povedano drugače, kakovost napovedi se povečuje tako, da s klasičnimi napovedmi vsako desetletje 'pridobimo' približno en dan pri enaki natančnost. Delno je to posledica večje računske moči, a enako pomembna sta tudi naraščanje količine dostopnih podatkov in boljše razumevanje procesov v atmosferi.

Renesansa umetne inteligence se je resda začela v zadnjem desetletju, ni pa to njena geneza. V meteorologiji so bila 60. in 70. leta preteklega stoletja obdobje velikih sprememb. Izboljševalo se je poznavanje fizikalnih procesov, ki vplivajo na dogajanje v atmosferi, hkrati pa se je računska moč – z današnjega gledišča resda skromna – hitro povečevala. Računski modeli so postajali osrednje orodje pri napovedovanju. Že sredi 60. let so preizkušali pristope, ki bi jih v današnji terminologiji označili kot umetno inteligenco. V ZDA je pionir statistične meteorologije Bob Glahn v začetku 60. let med drugim uporabljal tudi adaptivno logiko, kar bi danes uvrstili med pristope z nevronskimi mrežami.

Veliki trije

Pred pol stoletja so bili začetki skromni, danes pa umetna inteligenca kuka iz vsake špranje. Tehnološki velikani so jo prepoznali kot naslednjo veliko priložnost, zato preučujejo najrazličnejše potencialne uporabe. Pri vremenskih napovedih so to Nvidijin FourCastNet, DeepMindov GraphCast in Huaweijev Pangu-Weather. Zaradi njih so meteorologi pred premislekom, kako uporabljati strojno učenje in vremenske napovedi, je lani julija dejal Peter Düben, vodja oddelka za modeliranje Zemlje na ECMWF (Evropski center za srednjeročne vremenske napovedi).

ECMWF upravlja enega izmed najbolj znanih globalnih modelov za napoved vremena, ki je za 15-dnevne napovedi zlati standard. Svoj superračunalnik imajo na obrobju italijanske Bologne, kjer so leta 2021 postavili 80 milijonov evrov vredno gručo s štirimi sistemi BullSequana XH2000 s približno milijonom procesorskih jeder in z dvema petabajtoma pomnilnika. Od oktobra 2022 na njem teče model ECMWF, ki 'vidi' svet kot rezine z vodoravnima dimenzijama devet kilometrov, v višino pa jih je naloženih približno sto. To je prostorska ločljivost modela, ki se požene štirikrat dnevno (vsakih šest ur) in s korakom eno uro izračuna vreme na planetu. Model ECMWF je fizikalni, torej vsebuje matematični opis znanih procesov v atmosferi (nekateri so poenostavljeni), v katerega vstavijo podatke iz meritev. Načelno je tak model sposoben napovedati tudi dogodke brez zgodovinske primere. Lansko avgustovsko obilno deževje v Sloveniji, ki ga marsikje v času sistematičnega opazovanja in modeliranja vremena še nismo opazili, je model brez težav predvidel. To je pomembna podrobnost, h kateri se bomo pri napovedih z umetno inteligenco še vrnili. Ni namreč jasno, ali bo umetna inteligenca sposobna napovedati redke ekstremne dogodke, ki jih v podatkih ta trening na nekem področju nima, pojasnjuje Düben.

Kateri izmed treh velikih modelov umetne inteligence je boljši, je zagonetno vprašanje, na katero ima vsak ponudnik drugačen odgovor. Tudi na splošnejše vprašanje, ali so modeli boljši od ECMWF-jevega ali pa za slovenske razmere prilagojenega lokalnega ALADIN-a, odgovor ni enoznačen. Dejstvo pa je, da ne gre za znanstveno radovednost ali prestiž, pojasnjuje Oliver Fuhrer, ki pri švicarski Upravi za meteorologijo in klimatologijo vodi oddelek za numerične napovedi. Od vremena je odvisno tudi gospodarstvo, s čedalje večjim zanašanjem na obnovljive vire pa postajajo vremenske napovedi eksistencialno pomembne. Tudi na mikroravni posameznih podjetij je vreme pomembno, saj vpliva tako na veliko logistiko kakor prodajo sladoleda.

Huawei Pangu-Weather

Pri umetni inteligenci pogosto poudarjamo, da jo moramo za uporabo najprej izuriti s podatki, ki so podobni produkcijskim. Jure Cedilnik iz Agencije za okolje (Arso) pojasnjuje, da »gre izjemen uspeh metod umetne inteligence na področju meteoroloških napovedi pripisati tudi ali predvsem zelo dobri učni množici, na kateri se te metode učijo«. Ko je Huawei gradil svoj Pangu-Weather, je uporabil zgodovinske podatke za zadnjih 39 let in jih reanaliziral. Kot pojasnjujejo pri ECMWF, daje reanaliza najnatančnejše mogoče podatke o preteklem vremenu. Gre za kombinacijo meritev iz preteklosti in ponovnega poganjanja modernih kratkoročnih modelov na teh podatkih. Rezultat so globalni, konsistentni in popolnjeni podatki 'brez lukenj'. Na tak način je mogoče pridobiti podatke enake zrnatosti, kot so moderni, četudi v preteklosti za kakšno področje natančnih meritev ni bilo.

EMCWF ima zbirko reanaliziranih podatkov vse od leta 1940, ki se imenuje ERA5 in je brezplačno dostopna v C3S (Copernicus Climate Change Service) Climate Data Store. Petica pomeni, da so podatki dostopni z zamikom petih dni, kolikor traja reanaliza aktualnih podatkov. Z drugimi besedami to pomeni, da so od leta 1940 na voljo podatki kot homogeni tridimenzionalni niz za vse glavne meteorološke količine s prostorsko ločljivostjo 31 km in časovno ločljivostjo 1 ure. Če vas zanima, kakšno je bilo vreme 30. januarja 1964 v Ljubljani ali na Kilimandžaru, zdaj veste, kam pogledati.

Na takšni zbirki se je uril tudi Pangu-Weather, katerega napovedi so danes dostopne tudi javnosti na straneh ECMWF. Njegova brezplačna napoved sega 10 dni v prihodnost in obsega hitrost vetra, temperaturo, zračni tlak na različnih višinah in druge parametre. Huawei se je pohvalil, da je Pangu-Weather primerljivo natančen kot ECMWF-jev model. Podobno seveda trdijo tudi drugi, denimo DeepMindov (Googlov) GraphCast. Ta trdi, da so ga z ECMWF-jem primerjali v 1.380 metrikah in pri 90 odstotkih naj bi bil natančnejši. Matthew Chantry, ki pri ECMWF koordinira projekte strojnega učenja, je novembra lani dejal, da je GraphCast konsistentno boljši od modelov Pangu-Weather in FourCastNet.

Vsi pa se strinjajo, da so hitrejši in učinkovitejši. Chantry pojasnjuje, da so ti modeli od tisoč- do desettisočkrat hitrejši kakor klasični. GraphCast izdela 10-dnevno globalno napoved na enem računalniku Google TPU v4 (4.096 čipov s skupno porabo 200 W) v eni minuti. Podobno hitri so tudi drugi modeli umetne inteligence in tudi precej natančni. Da bo hurikan Lee lanskega septembra trčil ob obalo Nove Škotske v Kanadi, je GraphCast napovedal devet dni pred dogodkom, klasični model pa šest dni prej. A po drugi strani ni bil nič boljši pri napovedi poti hurikana Otis na zahodni mehiški obali. Lingxi Xie, ki sodeluje pri razvoju modela Pangu-Weather, je že julija lani pojasnjeval, da novi modeli dobro napovedo, kam bodo tropski cikloni treščili, manj dobro pa ocenijo njihovo intenzivnost.

Vseeno meteorologov umetna inteligenca ne bo nadomestila, saj mora podatke še vedno nekdo znati zbrati, obdelati in interpretirati. Laikom informacija o geopotencialni višini ploskve 500 hPa ne pove kaj dosti, meteorologi pa dobro razumejo, zakaj je tam gibanje zraka v vertikalni smeri najmočnejše in kako to vpliva na napovedi.

Sodelovanje

Meteorološke službe zato napovedovanja vremena z umetno inteligenco, ki se ga poskušajo iti tehnološki velikani, niso vzele kot grožnje ali vojne napovedi, temveč kot priložnost. Benedikt Strajnar z Arsa pravi, da se »dogaja prava mala revolucija in je to dogajanje tako pomembno, da si ECMWF ne more privoščiti, da ne bi bili zraven in ne bi razvili svojih kapacitet na tem področju«. Tega se zaveda tudi Arso in dogajanje natančno spremlja, dasiravno so današnji začetni vložki še veliki. A kot bomo videli v nadaljevanju, je Arso s partnerji pri razvoju specializiranih modelov vodilni v evropskem merilu.

Sistemsko je ECMWF pristopil k integraciji umetne inteligence januarja 2020, ko so organizirali interno delavnico, kjer so njihovi znanstveniki in analitiki predstavili projekte strojnega učenja, pri katerih so delali. Pred tem namreč ni bilo centralnega pregleda, kje vse se ta tehnologija že preizkuša. Potem so ugotovili, da pri ECMWF teče 25 projektov, kjer tako ali drugače izkoriščajo strojno učenje. Umetno inteligenco si običajno predstavljamo v velikopoteznih projektih globalnega napovedovanja vremena, a to sploh ni nujno. Tudi manjša opravila, kot sta popravljanje sistematičnih pogreškov (bias) na satelitskih meritvah ali pa zgolj monitoring IT-infrastrukture, so uporabljala elemente strojnega učenja. Štiri leta pozneje imamo obsežne modele, izurjene na desetletjih podatkov.

»Pri klasičnem numeričnem napovedovanju vremena so omejitve predvsem nenatančno poznavanje začetnega stanja, omejeno poznavanje fizikalnih zakonov in končna računska moč,« pojasnjuje Cedilnik. Zaradi tega je treba zvezni prostor diskretizirati, kar po domače pomeni, da ima omejeno prostorsko in časovno ločljivost. »Tako časovna kot prostorska gostota meritev je še vedno skopa, zato ne glede na metodo vremena v horizontalni smeri ne moremo simulirati natančneje kot na 500 metrov. To je precej bolje od ločljivosti radarjev, satelitov in gostote merilnih mrež, zato bi že zgolj za validacijo modelov potrebovali več meritev,« dodaja Strajnar.

Ena izmed prednosti modelov umetne inteligence je možnost izdelave ansambelskih napovedi. Dasiravno je vreme kaotičen sistem, so dandanes napovedi za širšo javnost predstavljene kot deterministične, čeprav gre v resnici za verjetnosti. Verna napoved pa bo imela vedno informacijo o zanesljivosti oziroma pogrešku (error bar). Če napoved za isto obdobje poženemo večkrat, pri čemer vsakokrat nekoliko spremenimo vhodne parametre, pa dobimo dodatno informacijo o stabilnosti ozračja. »Tu bo lahko umetna inteligenca v bližnji prihodnosti igrala veliko vlogo, saj bo za neki dogodek mogoče izračunati še precej več enako verjetnih napovedi ter jih statistično ovrednotiti,« meni Cedilnik

Klasični EMCWF-jev model, ki smo ga tolikokrat omenili, se imenuje IFS (Integrated Forecasting Model). Od lanskega poletja pa ECMWF razvija tudi AIFS (Artificial Intelligence/Integrated Forecasting System). Prve napovedi so objavili oktobra 2023 in je trenutno v fazi alfa. Na straneh ECMWF (charts.ecmwf.int/catalogue/packages/ai_models/) so dostopne napovedi modelov: AIFS, FourCastNet (Nvidia), FuXi (Univerza Fudan), GraphCast (Google DeepMind) in Pangu-Weather (Huawei).

Napoved temperature za 12 ur vnaprej dne 14. 1. 2024 modela umetne inteligence AIFS. Slika: ECMWF

Omenjeni modeli se med seboj nekoliko razlikujejo po pristopu. AIFS in GraphCast uporabljata grafovske nevronske mreže (graph neural networks), FourCastNet spektralne transformacije, Pangu-Weather in FengWu pa vizualne transformerje. AIFS, ki ga razvija ECMWF, ima ločljivost ene stopinje in 13 tlačnih nivojev. V alfa različici so tridnevne napovedi približno enako zanesljive kakor IFS, nato pa se napaka poveča na 10 odstotkov v primerjavi z IFS, merjeno kot pogrešek pri določitvi geopotencialne višine za izobaro 500 hPa.

Pogrešek pri določitvi geopotencialne višine za izobaro 500 hPa v klasičnem modelu (IFS) in z umetno inteligenco (AIFS) za obdobje junij–avgust 2023 na severni polobli. Slika: ECMWF

Poleg globalnih modelov za srednjeročne napovedi se umetna inteligenca uporablja tudi za razvoj specializiranih modelov, ki ocenijo verjetnost za padavine ali ekstremne dogodke v zelo bližnji prihodnosti. DeepMindov DGMR (Deep Generative Model of Rain) je že leta 2021 napovedoval verjetnost za padavine v prihodnjih 90 minutah, kitajski NowcastNet pa lani ekstremne dogodke v naslednjih treh urah. Tej vrsti napovedi s tujko pravimo nowcasting (torej zdajšnje napovedovanje).

Ahilova tetiva

Ena izmed manj pričakovanih groženj napovedovanju vremena z umetno inteligenco so podnebne spremembe. Nevronske mreže nimajo mehanističnega razumevanja, temveč se učijo iz preteklih podatkov, kjer iščejo korelacije. Čim bolj predvidljiv je sistem, tem boljše bodo napovedi. Podnebne spremembe pa postavljajo to predvidljivost pod vprašaj, saj je zaradi globalnega segrevanja današnje podnebje že nekoliko drugačno kot pred 39 leti, kolikor so stari najstarejši podatki za urjenje modela Pangu-Weather. Leto 2023 je bilo z naskokom najtoplejše, odkar sistematično merimo vreme. Od predindustrijske dobe je bilo 1,5 °C toplejše, od sredine 80. let pa za približno stopinjo.

To so že vrednosti, ki lahko povzročajo težave modelom, ki so urjeni na starejših podatkih. Kot pravi Cedilnik, »se je umetna inteligenca naučila vse o vremenu za obdobje, ko antropogeni učinek ni imel bistvene vloge, kar je problematično pri napovedovanju ekstremnih dogodkov«. »Ali bo umetna inteligenca lahko prepoznavala nove vremenske vzorce, ta hip še ni jasno, čeprav obstajajo dokazi o kreativnosti mrež, ki so naučene na ogromni količini podatkov,« dodaja Peter Mlakar iz Arsa.

Odvisnosti namreč niso vedno linearne, temveč višja temperatura predstavlja več energije v atmosferi, kar proži več močnejših ali izrednih vremenskih dogodkov, včasih tudi na območjih, kjer jih doslej ni bilo. Vročinski valovi, suše, neurja, požari so v zgodovinskih podatkih redkeje zastopani, kot se dogajajo danes, kar bi lahko povzročilo slabše napovedi.

V praksi

Modeli strojnega učenja trenutno trkajo na vrata, a se pri vsakodnevni rabi še ne uporabljajo. Jure Cedilnik, ki v Agenciji za okolje (Arso) vodi Sektor za meteorološko in oceanografsko modeliranje, je povedal, da imajo v Agenciji vpogled v izračune modelov Pangu-Weather, DeepMind, FourCastNet in AIFS, ki jih poganja ECMWF, a vsakodnevni proces še vedno uporablja izključno klasične modele. Modeli umetne inteligence pa so uporabni pri izboljševanju zanesljivosti obstoječih napovedi v postopku poprocesiranja, pojasnjuje Mlakar. Kadar modelne napovedi sistematično odstopajo od dejanskih meritev, lahko sistematične napake odpravijo s strojnim učenjem, če je za količino na voljo tudi dejanska meritev. Taki primeri so temperature pri tleh, količine padavin, hitrost vetra in podobno. Tak model ta hip postavljajo pri Arsu.

V produkciji pa se že uporabljajo modeli HIDRA za napoved višine gladine morja, ki so jih razvili Marko Rus (Arso UL FRI), Lojze Žust (UL FRI), Matjaž Ličer (Arso, NIB), Anja Fettich (Arso) in Matej Kristan (UL FRI). Medtem ko so prve različice uporabljale globoke konvolucijske mreže novejše tudi transformerje. Modele HIDRA so urili na grafičnih karticah slovenskega superračunalnika Vega v Mariboru, za trening pa so uporabili atmosferske simulacije ECMWF ter izmerjeno gladino morja v Kopru (in kasneje tudi drugod na Jadranu). Gre torej v celoti za sad slovenskega dela.

Najnovejši model HIDRA že danes gladino morja in s tem poplavljanje v Piranu napove bolje od vseh fizikalnih modelov, tudi tistih, ki so bili razviti posebej za severni Jadran. Hkrati so polmilijonkrat hitrejši od fizikalnih modelov, ker izračunavajo le gladino morja na želeni lokaciji – na primer v Piranu – in ne morskih tokov, slanosti in gostotnega polja v celotnem Jadranu. Modeli HIDRA se tako že vsak dan poženejo na Arsovem superračunalniku. Model je tako uspešen, da se HIDRA danes uporablja tudi na Baltiku. Zaradi njegove uspešnosti ga bo v prihodnosti tudi ECMWF vključil v operativna orodja za napovedovanje ekstremnih gladin, dodaja Matjaž Ličer iz Arsa, ki je sodeloval pri razvoju.

Topobatimetrija Jadranskega morja, kot jo uporablja model HIDRA. Slika: Rus, M. et al. Geoscientific Model Development, 16, 271–288, 2023

Še en podoben model je DELWAVE, ki so ga slovenski raziskovalci razvili v sodelovanju z italijanskimi in simulira vedenje kompleksnih ter numerično dragih fizikalnih modelov za površinske gravitacijske valove. Ker je spet bistveno hitrejši od numeričnih modelov, lahko z njim valovno polje v Jadranu opisujejo tudi v stoletnem merilu.

Lokacije merilnih mest, od koder so podatki za trening modela DELWAVE. Slika: Mlakar, P. EGUsphere, 2023, 10.5194/egusphere-2023-718

Pogled naprej

Meteorologi so glede prihodnosti napovedovanja vremena z umetno inteligenco optimistični. »Mogoče je, da bo v nekaj letih umetna inteligenca prevzela operativni izračun napovedi (integracija modelov v času), razvoj klasičnih modelov pa bo namenjen predvsem sprotnemu prilagajanju učne množice za trening. Umetna inteligenca se bo tako vsake toliko časa ponovno naučila ali doučila česa o vremenu,« meni Cedilnik.

Dihotomija med fizikalnimi (numeričnimi) modeli, ki 'razumejo' dogajanje v atmosferi, in umetno inteligenco, ki kot črna škatla zgolj napoveduje prihodnost, pa bi lahko v prihodnosti izginila, pravi Ličer. »Dodajanje fizikalnih zakonov v modele umetne inteligence je ključno, saj s tem omejimo prostor iskanja rešitev na zgolj fizikalno smiselne scenarije. Nove generacije umetne inteligence bi morale poznati tudi zakone fizike, kar bo omogočilo ekstrapolacijo v primeru, ko se bo srečala s še nevidenimi scenariji.« Sam gleda na metodi kot komplementarni, ki se bosta združeni dopolnjevali pri reševanju problemov, ki so danes še pretežki. Kljub silovitemu razvoju računske moči in poznavanju fizike namreč še vedno ostajajo nerešeni problemi, denimo turbulenca, od česar so odvisne lokalne konvekcijske padavine. Ali po domače: meteorologi ne morejo napovedati, nad katerim zaselkom se bo ulila poletna nevihta, medtem ko bo v sosednji vasi sijalo sonce. Umetna inteligenca s poznavanjem fizike bi to v naslednjih desetletjih morda zmogla.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji