Olika sorts prognosfel
Numeriska prognoser innehåller alltid ett fel jämfört med naturens "sanna" värde, vid en viss plats och tidpunkt. Det sanna värdet är användarberoende eftersom tidsintervall och platsens storlek kan uppfattas olika. Det "sanna" värdet uppskattas med hjälp av olika observation som också är behäftade med olika fel, av instrumentkaraktär eller i form av hur mycket luft eller mark som mätes och hur fort de anpassar sig till förändringar. Prognosfel har i huvudsak två olika orsaker:
- De numeriska modellerna har vissa inneboende fel beroende på begränsad upplösning, approximationer och ofullständig kännedom om initialtillståndet. Dessa fel växer med prognoslängd då alla felkällor påverkar varandra och adderas eller till och med multipliceras i vissa fall.
- De numeriska prognosvärdena beräknas bara för en viss upplösning i tid och rum och representerar inte lokala avvikelser från arealmedelvärden i modellen. Speciella faktorer som påverkar är hav och land, topografi, urbaniseringsgrad, vegetation och markytans beskaffenhet.
Den första typen av fel är huvudsakligen slumpmässiga allt eftersom modellerna har förbättrats, men det finns fortfarande vissa situationsberoende fel som kan vara systematiska. T.ex. att molnigheten underskattas en viss säsong och vädersituation. Den andra typen av fel är mera systematiska men de varierar oftast med säsong och vädersituation. Om felen (avvikelser mellan prognos och observation) är systematiska så kan man använda statistiska metoder för att uppskatta felen från tidigare data och sedan applicera korrektioner på framtida data (prognoser).
Statistiska korrektioner kan vara statiska eller adaptiva
Statistiska metoder kan vara antingen statiska eller adaptiva. De statiska metoderna bestämmer korrektionsvärden en gång för alla, från ett stort historiskt material. Korrektionerna tillämpas sedan varje dag på samma sätt. Felkällor av den andra typen ovan, lokala effekter, kan korrigeras med den s.k. Perfect Prog metoden, dvs. att man använder analyserade data som också är initialdata för prognosmodellen och bestämmer avvikelser mellan analys och observation. Denna metod fungerar om prognosen skulle vara perfekt, dvs. att det är ingen feltillväxt under prognosens gång.
En mera komplicerad metod är att också korrigera den för felen i prognosmodellen. Då görs en regression mellan prognosmodellens värden (Model Output) och observationer. Dvs. att man uttrycker felen som en linjär kombination av ett antal prognosparametrar och värdena på koefficienter bestäms optimalt statistiskt sett. Flera olika prognosparametrar används och korrelationer och biaskorrektion räknas ut från många års data av prognoser och observationer. Detta kallas för Model Output Statistics (MOS) och kan vara ganska framgångsrikt och används främst i USA. Problemet med MOS är att man måste göra om den hela den statistiska regressionen varje gång man har ändrat i formuleringen av prognosmodellen.
Kalmanfiltrering är en adaptiv metod
Adaptiva metoder använder också biaskorrektioner och korrelationer med prognosparametrar men de förändras med tiden och anpassas successivt till de senaste observationerna (adapteras). En statistiskt optimal metod att göra en sådan anpassning är att göra Kalmanfiltrering (efter att arbete inom ingenjörsvetenskapen av Kalman med medarbetare 1960). Det bygger på att man har en ekvation för hur felet uppför sig, t.ex. konstant över tiden eller en konstant plus en koefficient gånger temperaturen, samt observationer mot vilka felet skall minimeras statistiskt. Observationer är ju behäftade med vissa fel och så man kan inte bara anpassa till den senaste observationen exakt. Koefficienterna i filtret tar hänsyn till en serie av tidigare observationer och försöker att anpassa en serie av data så bra som möjligt, men med störst vikt på de senaste observationerna. Figuren nedan visar hur temperaturen i Sodankylä i norra Finland prognoserats med ECMWFS globala modell (12-timmars prognoser) och hur dessa korrigerats med ett Kalmanfilter, jämfört med observationerna.