uzluga.ru
добавить свой файл
К.Г. Рубинштейн, И.Н.Новикова


Испытание метода статистической детализации сезонного прогноза погоды

для региона Москвы


Введение


В настоящее время во многих центрах мира интенсивно разрабатываются методы численного прогноза на сезон. Результаты подобных прогнозов пока что не всегда хороши, в связи с этим разрабатываются различные методы, с помощью которых делается попытка уменьшения систематических ошибок.

Один из подобных подходов в англоязычной литературе называют статистический “downscaling”. Под термином “downscaling” (ДС) подразумевается более широкое понятие – это методы статистической, динамической [16] или вариационной [13] региональной интерпретации результатов прогнозов крупномасштабных гидродинамических моделей.

В отечественной терминологии нет установившегося аналога английского термина “downscaling”. Буквальный перевод английского термина downscaling – уменьшение масштаба – довольно точно, хотя и не полно, отражает суть этого метода. В работе [9] предполагается переводить его как “детализация” прогноза. Гораздо раньше, примерно лет на десять, в работах отечественных авторов появился термин ‘телескопизация’ прогноза, близкий к этому современному термину, хотя и имевший оттенок численной процедуры совмещения модельных расчетов на сетках различного пространственного разрешения.

Интерес к подобным методам в последние годы связан с недостатками в численном прогнозировании погоды на сроки месяц-сезон и попытками улучшить их результаты с помощью специально разработанных процедур.

Проведенные многочисленные эксперименты показали, что статистические модели позволяют восстановить более 70% изменчивости мелкомасштабного поля. Ошибка решения задачи детализации может быть значительная, причем, следует отметить, что с увеличением среднеквадратичной ошибки восстановления растет вероятность “выброса”, т.е. неоправданного прогноза экстремальной метеорологической величины, что может сделать неприемлемым использование ряда статистических моделей для решения практических задач. Для построения статистических моделей необходимо знать первые и вторые моменты рассматриваемых величин, оценка которых проводится на основе априорной информации, а именно, временных рядов наблюдений.



  1. Краткий обзор статистических методов детализации прогнозов


Так как в данной работе использовались результаты статистических методов интерпретации, для обоснования выбранных методов кратко опишем существующие методы статистического ДС.


1.1. Метод аналогов


В метеорологии метод был внедрен Н.А.Багровым [1, 2, 3] и получил широкое распространение для статистического прогноза метеорологических полей [6, 7, 8, 29, 31] и для краткосрочного климатического прогноза [17, 36]. Для задач ДС метод применялся в работах [18, 21, 39].

Этот метод в [40] был иллюстрирован на примере ДС зимних осадков (декабрь-февраль) на Иберийском полуострове, представленных данными нерегулярной сети наблюдательных станций. Авторы считают, что региональная переменная (осадки) определяется изменчивостью атмосферной циркуляции в Европейско-Североатлантическом секторе. В качестве крупномасштабной переменной было взято поле давления на уровне моря (SLP). Недостатком метода аналогов можно считать определенный субъективизм принятия решений. Весьма трудно обосновать использование первых пяти эмпирико-ортогональных функций (ЭОФ) и влияние уменьшения их количества на суммарную дисперсию и на конечный результат. Кроме того, ЭОФ более высоких порядков (выше 3) с трудом поддаются какой-либо интерпретации.


1.2. Линейные методы


Линейные методы наиболее популярны в задачах ДС в первую очередь в связи с их простотой. Основная идея линейных методов – использование линейной связи между аномалиями крупномасштабной циркуляции и аномалиями локальных переменных [15, 17, 19, 24, 33, 35; 37].

Особенности линейных методов ДС были изучены в [37] на рассмотренном выше примере зависимости между SLP над Северной Атлантикой и зимними осадками на Иберийском полуострове, но по более частой наблюдательной сети. Представленная модель была построена на основе метода канонических корреляций. Этот метод позволяет определить пары полей, временная эволюция которых оптимально коррелирована. Он широко применялся как отечественными авторами [4, 5, 11], так и зарубежными [17, 19].

В работе [37] канонические корреляции рассчитывались для первых двух ЭОФ поля SLP над Северной Атлантикой. В этой работе считается, что уже первые две ЭОФ описывают около 80% общей изменчивости. Полученные результаты позволили авторам оценить региональные аномалии осадков на наблюдательных станциях для данного поля крупномасштабной аномалии давления на уровне моря. Необходимо отметить, что анализ канонических корреляций дает оценку максимально возможной корреляции между двумя полями. Учитывая приведенные ими же оценки, нетрудно подсчитать, что в результате было воспроизведено около 60% суммарной дисперсии.

В работе [25] было показано, что методы множественной регрессии и дискриминантного анализа являются частными случаями метода канонических корреляций. Метод множественной регрессии, вероятно, является самым распространенным статистическим методом в метеорологии, в том числе и для задач статистического ДС. В работе [33] представлена регрессионная модель для прогнозирования региональной температуры по результатам модели общей циркуляции атмосферы (ОЦА) в концепции, подобной MOS (Model Output Statistics). Уравнения регрессии для средних сезонных величин были найдены для 8 городов США и сравнивались с результатами совместной климатической модели (ССМ). Большинство этих уравнений описывают более чем 90% дисперсии температурных рядов. Аналогичные исследования были выполнены в [34]. Модель ДС также строилась на уравнениях регрессии для 31 пункта центрального района Аргентины. В качестве предикторов использовались значения моделируемой температуры на высоте 2 м, давление на уровне моря и составляющие скорости ветра на уровнях 700 и 200 гПа. Последние, по мнению авторов, необходимы для учета зоны струйного течения, влияющего на погоду в этих широтах. Как видно из представленных результатов, наилучшую корреляцию с локальной температурой имеют модельные значения температуры на уровне 2 м (0,640,93), с остальными параметрами наблюдается гораздо худшая отрицательная корреляция (-0,35 -0,48). Все значения признаны статистически значимыми. Проверка на независимом материале показала существенное уменьшение описываемой дисперсии температуры. Данный пример хорошо иллюстрирует основную проблему регрессионных моделей: определение состава и размеров вектора-предиктора.

Другая проблема заключается в разной дисперсии поля локальной переменной (предиктанта) и крупномасштабного поля (предиктора). В работе [38] предлагается использовать технику «инфляции», которая, по мнению автора, делает прогнозируемую изменчивость более реалистичной.


1.3. Методы классификации


Методы классификации не обязательно могут быть линейными, но мы ограничимся только ими. Классификационные схемы атмосферной циркуляции строятся на исторических наблюдениях в районе, для которого производится ДС, распределенных по определяемым классам. Полученные критерии классификации применяются затем к крупномасштабной циркуляции; таким образом, для каждого класса локальной переменной находятся синхронные наблюдения крупномасштабной переменной. Величина локальной переменной может быть выбрана как любая средняя из всех региональных наблюдений элементами одного класса крупномасштабной переменной или принадлежать только одному элементу выбранного класса. Применение конкретной стратегии зависит от поставленной задачи. Оценка выполненной классификации должна базироваться на показателях, включающих временную структуру, такую как продолжительность.

Практической проблемой является выбор метода для классификации крупномасштабной переменной. Существует множество методов классификации, и все они в той или иной степени субъективны, хотя, однажды определенные, они позволяют создать программируемую схему классификации объектов крупномасштабной атмосферной циркуляции. В большинстве схем классификации берется только область, над которой исследуются данные, и число классов определяется субъективно на стадии ее разработки.

Гораздо большей сложностью отличаются схемы объективной классификации [например, 14]. Одним из общих свойств объективной классификации является необходимость задания метрики, т.е. численной меры различия между любыми парами одноименных признаков, а также метрики пространства признаков, т.е меры различия между любыми парами классифицируемых объектов с учетом значения их признаков.

Для задач ДС используются:

  • схемы классификации, которые зависят только от данных крупномасштабной циркуляции;

  • схемы классификации, зависящие только от локальной переменной;

  • схемы, которые используют оба типа данных.

Типичным примером анализа из первой и второй групп является применение кластер – анализа типов атмосферной циркуляции [20].


1.4. Кригинг


В работе [18] исследуется возможность использования ДС как процедуры интерполяции, известной как кригинг. Основная идея метода заключается в том, что значение переменной в точке интерполяции ищется как взвешенная сумма значений этой переменной в известных точках. Этот метод может быть использован практически для всех данных, обладающих пространственной корреляцией. Авторы [18] представили пример использования этого метода для реконструкции месячных сумм зимних осадков на Иберийском полуострове по полю приземного давления в зимний сезон над Северной Атлантикой. Пространственная размерность поля была уменьшена с помощью ЭОФ. Количество осадков, связанное с этой точкой, оценивалось кригинг-интерполяцией в пространстве ЭОФ.

В целом кригинг и метод аналогов реалистично воспроизводят средние месячные значения осадков. В некоторой степени кригинг лучше описывает пространственные изменения, но в отличие от метода аналогов он занижает временную дисперсию, т.к. обладает хорошо известным сглаживающим свойством. Ограничением в применении кригинга является требование стационарности. Однако на практике такое сильное предположение неприменимо. Вместо этого используют более слабые предположения.


1.5. Нейронные сети


Нейронные сети (НС) в последние годы нашли широкое применение как статистический инструмент. Достаточно полный обзор на эту тему можно найти в [30]. В метеорологии этот метод был, по-видимому, впервые применен в 1992 г. [23]. Технология НС имеет достаточно широкие возможности, но известно сравнительно мало работ, в которых она применяется задаче ДС [26, 27].

Была построена НС для описания суточных осадков в зимний сезон в Испании за период 1978-1983 гг. [40]. Входными параметрами, как уже было сказано, являются коэффициенты первых пяти ЭОФ приземного поля давления, рассчитанные на суточных значениях. Согласие с наблюдениями получается лучше для сглаженных рядов, что указывает на существование высокочастотной изменчивости, не описываемой рассмотренными методами. Однако осталось неясным, какой вклад вносит каждый параметр и как использование последних по времени наблюдений улучшает прогноз.

Весь проведенный анализ методов ДС показывает, что основной проблемой ДС является проблема уровня моделируемой изменчивости. Линейные модели и нейронные сети, в целом описывают частичную связь между «независимыми» переменными, представляющими крупномасштабную изменчивость и «зависимыми» локальными переменными. Часть локальных переменных, не описанных независимыми переменными, обычно считаются шумом. Некоторые авторы [28] используют завышенные коэффициенты регрессии линейной модели, чтобы увеличить изменчивость на выходе. Чему отдать предпочтение – воспроизведению средней или воспроизведению изменчивости, зависит от специфики конкретной задачи.



  1. Реализованный метод множественной регрессии



2.1. Исходные данные


В работе использовались сезонные прогнозы температуры, полученные с помощью моделей AGCM2 (Second Generation Atmospheric General Circulation Model – модель общей циркуляции атмосферы второго поколения) и глобальной спектральной модели SEF Канадского Климатического Центра (Canadian Centre for Climate Modelling et Analysis – CCCMA) (www.cccma.bc.ec.gc.ca/models/gcm2.shtml) [32, 22].

Для анализа были взяты прогнозы для четырех сезонов за 26 лет (1969-1995 гг.). Модели AGCM2 и SEF являются глобальными моделями с пространственным разрешением 3,75° по долготам и широтам, т.е. слишком грубым для описания локальных или региональных особенностей.

В качестве потенциальных предикторов исследовались параметры выходной продукции AGCM2 и SEF: прогноз следующих метеовеличин – приземной температуры воздуха в С на высоте 2 м (T), давление на уровне моря в гПа (P), температура воздуха на изобарической поверхности 700 гПа (T700), высота изобарической поверхности 500 гПа в метрах (H500). Прогностические величины являются средними для стандартных сезонов: зима, весна, лето, осень. Для каждой из этих величин имеется по шесть членов ансамбля, которые получены за счет интегрирования при разных начальных условиях со сдвигом на шесть часов (6 ч, 12 ч, 18 ч, …... 36 ч). В тексте члены ансамбля будут обозначаться соответственно как первый, второй, ….. , шестой члены ансамбля (01, 02, 03, 04, 05, 06).

Для России были выбраны 28 объектов, для которых предполагалось проводить ДС. В их числе наиболее крупные города России и отдельные важные экономические объекты. Обязательным условием проведения статистического ДС является наличие длинных и надежных рядов наблюдений. В данной работе мы демонстрируем результаты ДС для точки с координатами г. Москвы. В качестве эмпирических были использованы данные синоптической станции ВДНХ в г. Москве.

Все ряды сезонных прогнозов температуры билинейно интерполировались в точку с координатами г. Москвы (интерполяция производилась по каждому члену ансамбля).


2.2. Описание используемого метода ДС–метода множественной регрессии


На основе проведенного анализа методов ДС на данном этапе, был выбран один из наиболее простых и эффективных методов – метод множественной регрессии.

Суть разработанного алгоритма состоит в расчете регрессионной модели для выбранной области по зависимой выборке и использовании выбранной регрессионной модели для описания прогноза приземной температуры в регионе.

Один из наиболее распространенных подходов к оцениванию параметров регрессионной модели, который применялся в работе [10, 12] заключается в следующем: вводится мера рассогласования отклика и регрессионной функции, и оценки параметров регрессии определяются так, чтобы сделать это рассогласование наименьшим. Достаточно простые расчетные формулы для оценок получают при выборе критерия в виде суммы квадратов отклонений значений отклика от значений регрессионной функции (сумма квадратов остатков):



Q (β0, β1) =ξ2 =(yi – β0 β1xi)2

min. .

β0, β1

(1)



Задача минимизации квадратичного критерия (1) носит название метода наименьших квадратов (МНК).

В работе применялась простая линейная и множественная линейная регрессии.



Y=А0+A1X12X23X3+…+АnXn

(2)







Уравнение (2) представляет собой уравнение регрессии, где X1, …, Xn являются предикторами, Y – предиктантом, А0,…, Аn, – коэффициентами, ξ – погрешность.

При оценке уравнений регрессии использовался метод корреляционного анализа. Применение методов корреляционного анализа в задачах регрессионного анализа позволяет произвести отбор влияющих факторов и выявить среди них наиболее информативные.

В качестве оценок рядов рассчитывались:

  • коэффициенты корреляции;

  • абсолютная ошибка:



А = ,


где ТЭ – эмпирическая (наблюдаемая) температура, – прогностическая температура или температура, полученная по уравнению регрессии, N – длина ряда;

– нормированная ошибка:


,


где D – дисперсия ТЭ;

– средняя квадратическая ошибка:


.


В качестве потенциальных предикторов использовались приземная температура (Т), давление на уровне моря (Р), температура воздуха на изобарической поверхности 700 гПа (T700), высота изобарической поверхности 500 гПа в метрах (H500). Для каждой из этих величин имелось по шесть членов ансамбля, которые получены путём расчета сезонных прогнозов при разных начальных данных.

Кроме ансамбля, связанного со сдвигом начальных данных, в нашем распоряжении имелись результаты второй канадской модели и, таким образом, мы имели не только результаты ансамблевых расчетов, но и результаты суперансамбля.

Весь ряд прогнозов был разделен на два временных интервала: 15-летний интервал (1969-1983 гг.) и 10-летний интервал (1984-1993 гг.); интервал I был использован как обучающий (зависимая выборка), а II – как интервал для тестирования (независимая выборка).


2.3. Статистический отбор предикторов


Для построения оптимальных уравнений регрессии использовалась процедура пошагового отбора наиболее информативных предикторов. Критериями отбора на каждом шаге являлись: множественный коэффициент корреляции, его уточненное значение с учетом числа степеней свободы и абсолютная ошибка. Использование пошаговой схемы дало возможность отобрать для каждого уравнения регрессии не более двух независимых предикторов, при которых множественный коэффициент корреляции достигал статистически значимого максимума, а абсолютная ошибка была минимальной. В результате, для каждого сезона по данным модели AGCM2 были построены уравнения регрессии, связывающие прогноз приземной температуры воздуха в точке с отобранными параметрами.

Опишем метод статистического отбора более подробно. Отбор предикторов осуществлялся следующим образом. На начальном этапе для зависимой выборки был найден парный коэффициент корреляции (R) эмпирической температуры (ТЭ) с каждым из шести членов ансамбля метеовеличин T, P, T700, H500, а также со средним значением по каждому ансамблю. По каждой величине (T, P, T700, H500) получилось по семь значений парных коэффициентов корреляции (например, для T – , , , , , , , аналогично и для других величин). По всем четырем сезонам из каждого ансамбля отбирался наилучший коэффициент корреляции с эмпирической температурой (результаты представлены в табл. 1).


Таблица 1

Парные коэффициенты корреляции между эмпирической температурой и членом ансамбля сезонных прогнозов приземной температуры, давления на уровне моря, температуры воздуха на изобарической поверхности 700 гПа и высоты изобарической поверхности 500 гПа по гидродинамической модели AGCM2 для точки с координатами г. Москвы (зависимая выборка – I). Представлен член ансамбля с максимальной корреляцией.




п/п

Сезон




весенний

летний

осенний

зимний

1




0,67




0,55




-0,59




-0,63

2




0,55




0,50




-0,43




-0,55

3




0,43




0,49




0,37




-0,54

4




0,41




0,42




-0,19




-0,48


Затем для каждого сезона из коэффициентов корреляции составлялись четыре блока (блок состоит из коэффициентов корреляции между ТЭ и членом ансамбля метеовеличины); первый блок для какого-либо сезона состоит из корреляций метеовеличины, которая соответствует № 1 из табл. 1, второй блок - № 2 из табл. 1 и т.д.; первым членом блока оказывался член ансамбля с наибольшей корреляцией (блоки по каждому сезону в табл. 1 выделены жирной рамкой). Далее ранжирование этих четырех блоков производилось от максимального к минимальному R. Приведём пример ранжирования летнего сезона: первый блок будет состоять из коэффициентов корреляции ТЭ с Р, второй блок – из коэффициентов корреляции ТЭ с Т700, третий блок – из коэффициентов корреляции ТЭ с Н и четвёртый блок – из коэффициентов корреляции ТЭ с Т. В каждый блок отбирались не все семь парных коэффициентов корреляции, а только те, которые имели с максимальным R один и тот же знак и наибольшие по абсолютной величине (см. табл. 2).


Таблица 2

Парные коэффициенты корреляции между эмпирической температурой и членами ансамбля сезонных прогнозов давления на уровне моря (I блок), температуры воздуха на изобарической поверхности 700 гПа (II блок), высоты изобарической поверхности 500 гПа (III блок) и приземной температуры (IV блок) по гидродинамической модели AGCM2 для точки с координатами г. Москвы (зависимая выборка – I; летний сезон).


I блок

II блок

III блок

IV блок

элемент

R

элемент

R

элемент

R

элемент

R

Р01

РСР

Р05

Р04

Р06

Р03


0,55

0,36

0,34

0,32

0,11

0,09


Т70005

Т700СР

Т70004

Т70002

Т70006



0,50

0,33

0,24

0,19

0,16



Н05

Н01

НСР

Н04

Н06

Н02

Н03

0,49

0,46

0,44

0,34

0,18

0,14

0,05

Т05

ТСР

Т02

Т06



0,42

0,28

0,26

0,14



Примечание. В таблице указан элемент, с которым рассчитывался коэффициент корреляции с ТЭ.


Для дальнейшего отбора была применена следующая схема (на примере летнего сезона). Из каждого блока (летнего сезона) был взят элемент с максимальной корреляцией, а из третьего блока были взяты три первых элемента с максимальной корреляцией, т.к. её значение убывает медленно (т.е. были отобраны следующие элементы: Р01, Т70005, Н05, Н01, НСР, Т05). Затем из этих элементов отбирались два «наилучших» предикторов. Р01 – фиксированный элемент с наибольшей корреляцией из всех ансамблей четырех метеовеличин. Для отыскивания второго предиктора из вышеупомянутых элементов было построено шесть статистических регрессионных моделей: с одним предиктором (P01), с двумя предикторами (Р01 и Т70005), с тремя (Р01, Т70005, Н05), ….. , с шестью предикторами (Р01, Т70005, Н05, Н01, НСР, Т05). По результатам этих статистических моделей были рассчитаны множественные коэффициенты корреляции (RM), их уточненные значения с учетом числа степеней свободы (RA) и средние абсолютные ошибки результатов регрессии (A). Оценки этих шести регрессионных моделей представлены на рис. 1. По рис. 1 видно, что при добавлении в регрессионную модель второго предиктора (II) увеличивается уточнённый коэффициент корреляции (RA) и уменьшается средняя абсолютная ошибка. Итак, для дальнейшего анализа, в качестве предикторов отбираем Р01 и Т70005.

Аналогичным образом предикторы отбирались для всех остальных сезонов.

Для каждого сезона отбирались два «наилучших» предиктора, затем эти отобранные предикторы применялись ко всем сезонам. Таким образом, к каждому сезону было применено четыре регрессионные модели. Наиболее устойчивый результат имели регрессионные модели с предикторами Р01 и Т70004.

Далее в тексте Р01 и Т70004 будут указываться без индексов как Р и Т700.

Для каждого сезона с помощью стандартных пакетов получены следующие уравнения регрессии:

a) для весеннего сезона: , , ;

b) для летнего сезона: , , ;

c) для осеннего сезона: , , ;

d) для зимнего сезона: , , .

Были рассчитаны оценки температуры, полученной по уравнениям регрессии. В табл. 3 приведены результаты расчетов по различным уравнениям регрессии с одним предиктором – температурой на уровне 700 гПа (Т7) или давлением на уровне моря (Р), а также по уравнению регрессии с двумя предикторами (Т7, Р) для всех сезонов.

Из табл. 3 видно, что для всех сезонов максимальный коэффициент корреляции для прогнозов температуры по модели AGCM2 имеет уравнение регрессии с двумя предикторами (Т700 и P). Для второй прогностической модели этот результат не всегда подтверждается – это связано, возможно, с тем, что уравнения регрессии строились по результатам первой модели. Заметно улучшаются и остальные оценки при учете двух предикторов.


Таблица 3

Оценки расчетов приземной температуры воздуха по различным уравнениям регрессии, построенные по данным двух гидродинамических моделей для точки с координатами г. Москвы.

(зависимая выборка – I)



Сезон

Весенний

Летний

Осенний

Зимний

Регрессионная

модель

T7

P

T7, P

T7

P

T7, P

T7

P

T7, P

T7

P

T7, P

C (AGCM2)

C (SEF)

A (AGCM2), °С

A (SEF), °С

E (AGCM2), °С

E (SEF), °С

RMSE (AGCM2), °С

RMSE (SEF), °С

0,02

-0,03

1,28

1,29

3,87

3,88

1,62

1,99

0,55

0,30

1,10

2,18

3,23

5,91

1,35

3,03

0,59

0,31

1,03

1,84

3,14

5,23

1,32

2,68

0,24

-0,11

0,93

1,89

3,76

6,43

1,36

2,85

0,55

0,28

0,74

2,21

3,23

6,73

1,17

2,98

0,57

0,25

0,80

1,44

3,19

4,69

1,15

2,08

0,18

0,01

0,79

1,24

3,81

4,95

1,14

1,81

0,27

0,13

0,80

0,93

3,73

4,04

1,12

1,48

0,32

0,07

0,81

1,05

3,66

4,50

1,10

1,65

0,63

0,02

1,30

2,66

3,00

5,59

1,63

3,72

0,39

0,03

1,68

2,87

3,56

6,54

1,94

4,36

0,68

0,04

1,22

3,68

2,83

8,07

1,54

5,38

Примечание. С – коэффициент корреляции между эмпирической и прогностической температурой; А – средняя абсолютная ошибка ряда прогностической температуры; Е – нормированная ошибка; RMSE – средняя квадратическая ошибка.


Таким образом, в результате использованной процедуры для уравнения регрессии были отобраны следующие предикторы: температура на уровне 700 гПа и давление на уровне моря, т.к. они имели наиболее устойчивое влияние для всех сезонов. Малоинформативными оказались поля высоты поверхности 500 гПа и поле самой приземной температуры.

На основании анализа данных для зависимого периода в дальнейшем (при проведения ДС для независимого периода) использовались уравнения множественной регрессии с учетом двух предикторов – температуры воздуха на уровне 700 гПа и приземного давления Р.



  1. Анализ численных сезонных прогнозов приземной температуры воздуха



Прежде чем описывать алгоритм и результаты ДС, приведем оценки рядов сезонных прогнозов для точки с координатами г. Москвы по первому 15-летнему интервалу (1969-1983 гг.). Для этого были рассчитаны коэффициенты корреляции между рядами эмпирической температуры и каждым членом ансамбля прогностической температуры обеих моделей. Из шести коэффициентов корреляции для двух моделей был выбран максимальный (СМ). Кроме того, все шесть членов ансамбля для каждого сезона осреднялись с равными весами, и рассчитывался коэффициент корреляции эмпирической температуры со средним по ансамблю прогнозом (СА). Эта операция проводилась для каждой модели. Результаты приведены в табл. 4. В этой же таблице представлены средние абсолютные ошибки прогностической температуры для члена ансамбля, имеющего максимальную корреляцию с эмпирической температурой (АМ), а также для этого же члена ансамбля представлены нормированные ошибки (ЕМ) и RMSE (RMSEМ). Те же характеристики приведены для среднего по ансамблю прогноза (АА, ЕА, RMSEА). Из анализа таблицы видно, что наиболее высокие корреляции прогноза с наблюдениями по расчетам с помощью обеих моделей были в весенний период. Причем в осенний и зимний сезоны по обеим моделям корреляция отрицательная. Видно также, что для обеих моделей и для всех сезонов находился член ансамбля с более высокой корреляцией, чем средняя по ансамблю.


Таблица 4

Оценки сезонных прогнозов приземной температуры по двум гидродинамическим моделям для точки с координатами

г. Москвы (зависимая выборка – I).



Сезон

Весенний

Летний

Осенний

Зимний

Модель

AGCM2

SEF

AGCM2

SEF

AGCM2

SEF

AGCM2

SEF

CM

CA

AM, °С

AA, °С

EM, °С

EA, °С

RMSEM, °С

RMSEA, °С

0,67

0,38

6,71

7,73

16,37

19,09

6,85

7,99

0,72

0,62

3,25

3,29

8,25

8,51

3,45

3,56

0,42

0,28

1,38

1,28

4,41

4,16

1,60

1,50

0,55

0,43

1,93

2,11

6,26

6,83

2,26

2,47

-0,59

-0,50

1,28

1,14

5,81

4,92

1,47

1,47

-0,36

-0,08

1,01

0,96

5,08

4,25

1,52

1,27

-0,55

-0,32

4,70

4,38

10,52

9,30

5,72

5,06

-0,46

-0,31

3,34

2,30

6,86

4,82

3,73

2,62



Из сравнения табл. 3 и 4 видно также, что температура, вычисленная по уравнениям регрессии для всех сезонов, имеет заметно меньшую среднюю абсолютную ошибку, чем по результатам модельных прогнозов. Особенно значимы изменения для весеннего и зимнего сезонов: ошибка снизилась в 4 и 5 раз соответственно. В целом коэффициент корреляции вычисленной температуры, полученной по уравнению множественной регрессии, выше, чем для модельной для всех сезонов, кроме весеннего. Причем для осени и зимы коэффициент корреляции сменил знак на положительный (см. табл. 3 и табл. 4).

Наибольшие абсолютные и нормированные ошибки прогноза наблюдались также в весенний и летний сезоны, что связано с малой величиной дисперсии в эти периоды. Ошибки обеих моделей близки друг к другу. Отметим также, что в отличие от коэффициентов корреляции, ошибки средних по ансамблю для ряда сезонов (например, для лета) ниже, чем для лучших по коэффициенту корреляции прогнозов.



  1. Проверка результатов ДС на независимом интервале II



Прежде чем анализировать результаты ДС на независимой выборке, рассмотрим оценки сезонных прогнозов по обеим моделям в точке с координатами в г. Москва (табл. 5).


Таблица 5

Оценки сезонных прогнозов приземной температуры в точке с координатами

г. Москвы по двум гидродинамическим моделям

(независимая выборка – II).


Сезон

Весенний

Летний

Осенний

Зимний

Модель

AGCM2

SEF

AGCM2

SEF

AGCM2

SEF

AGCM2

SEF

CM

CA

AM, °С

AA, °С

EM, °С

EA, °С

RMSEM, °С

RMSEA, °С

0,44

0,28

8,41

7,83

24,37

22,28

8,73

7,98

0,42

0,07

3,63

3,67

10,78

10,86

3,86

3,89

0,52

0,45

1,24

1,06

4,42

11,97

1,25

3,39

0,62

0,42

1,92

1,94

6,11

6,31

2,12

2,19

0,67

0,11

1,32

1,29

4,01

4,35

1,65

1,79

-0,37

0,31

1,12

0,82

3,71

3,22

1,53

1,32

0,58

0,36

5,32

5,54

6,93

4,18

4,77

2,88

-0,58

0,15

3,46

2,68

4,27

3,51

3,59

2,96