Ученые из МФТИ и Института океанологии им. П.П. Ширшова РАН научили нейросети точно и быстро измерять значимую высоту волн — важную характеристику ветрового волнения на поверхности океана. По результатам исследования были опубликованы две работы в журнале Moscow University Physics Bulletin (1,2).
Ветровое волнение в океане изучают для повышения качества прогнозов погоды, разработки безопасных маршрутов для мореплавания, исследования изменений климата и экосистем, а также понимания воздействия на прибрежные зоны.
Значимая высота волны — это важная характеристика ветрового волнения в океане. Она равна средней высоте трети самых высоких волн. Эта величина характеризует статистическую природу волнения и используется как параметр в моделях прогноза погоды и для описания динамики процессов в океане.
Исторический метод наблюдения за волнением — визуальный — субъективен. К тому же в последние годы сокращается количество визуальных наблюдений за волнением. Автоматические современные методы — метеостанции на берегу, на дрейфующих или заякоренных буях с автоматическим оборудованием — в большинстве своем не оснащены приборами для определения характеристик волнения. Существуют специальные автоматические волномерные буи, которые дают достаточно точные измерения характеристик волн, но их мало, и их сеть распределена неравномерно по океану. Спутниковые данные тоже дают возможность оценивать некоторые параметры волнения, но не все; кроме того, эти оценки неточны, имеют низкое качество вблизи берегов и льдов, а также имеют ограничения на низких и высоких волнах. Поэтому задача повышения количества и качества наблюдений за характеристиками волнения является актуальной для океанологии.
Один из альтернативных путей, помимо оптической съемки цифровыми камерами, — это обработка данных судовых навигационных радаров, которые обязательно есть на всех судах, выходящих из порта. В «сырых» данных с таких радаров содержится информация о ветровом волнении.
Классический метод получения информации из данных радара — спектральный. Нужно сделать трехмерное преобразование Фурье, дорогую вычислительную процедуру, для примерно 400–500 «картинок» с радара или, что то же самое, примерно 20 минут радарного сигнала. На результатах этого преобразования выделяется зона, соответствующая ветровым волнам, и по соотношению сигнала к шуму определяется значимая высота волн. При этом в вычислениях используют специальные коэффициенты, уникальные для каждой модели радара, что приводит к необходимости настраивать метод под каждую модель отдельно.
Российские исследователи поставили перед собой задачу разработать метод, основанный на искусственных нейронных сетях, который точно, быстро и дешево будет определять нужные параметры волнения по одной радарной «картинке». В качестве референсных данных для обучения нейросетевой модели ученые использовали данные с волномерного буя, который запускали рядом с судном с радаром. Этот метод — измерения волномерным буем — считается наиболее точным в задаче определения характеристик волнения.
Сырые радарные данные получали с помощью специальной приставки к стандартному судовому радару SeaVision, разработанной компанией «Морские комплексы и системы» (г. Санкт-Петербург). Далее на данных радара и референсных данных с волномерного буя обучали нейросеть и сравнивали результаты работы обученной модели с результатами спектральной обработки радарных изображений.
«Получилось, что по картинке с радара, которая за две с небольшим секунды обозревает поверхность океана вокруг парохода, мы можем определить достаточно точно — не хуже, чем в спектральном подходе — значимую высоту волны», — комментирует Михаил Криницкий, заведующий лабораторией машинного обучения в науках о Земле МФТИ.
Во второй работе ученые решали проблему со сложностью получения референсных данных для обучения нейросетевой модели. Измерение параметров волнения волномерным буем — точный, но дорогой и неуниверсальный метод. С его помощью, например, опасно измерять слишком большое волнение, а собирать большое количество данных с разными высотами волн очень дорого.
Чтобы получить больше данных для обучения нейросетей, ученые специально математическим методом синтезировали радарные картинки.
«В основе метода мы использовали спектр развитого волнения Пирсона — Московица. Делали преобразование Фурье белого шума и накладывали на него компоненты, регулирующие направление и величину ветрового волнения, “программируя” изображения с заданными параметрами. Дальше мы преобразовывали образ обратно в декартовы координаты и применяли правила геометрической оптики, вычисляя, какая часть каждой волны видна на радарном изображении. Так мы получали искусственные картинки, которые очень близки к реальным, с определенными параметрами ветрового волнения. Таких искусственных изображений мы можем сгенерировать очень много без затрат на океанологическую экспедицию. Кроме этого, высоты волн, которые мы можем заложить в эти синтетические данные, могут быть гораздо выше по сравнению с теми, которые можно безопасно измерить в море», — объясняет Михаил Криницкий.
Для обучения нейросети в этом исследовании применяли три последовательных подхода. Сначала для внедрения в нейросеть «понимания» о том, какие бывают радарные картины, ее обучали их повторять как можно точнее. Вторым этапом ту часть нейросети, которая выучила характерные особенности радарных снимков, использовали как часть для новой нейросети, задачей которой стало вычисление высоты волн в синтетических данных. Финальным этапом эту нейросеть дообучали определять высоту волн на реальных данных.
«В результате мы получили прирост точности определения значимой высоты волны на 4%. Это улучшение кажется незначительным, но оно показывает, что сам подход предварительного обучения на синтетических данных работает. Мы продолжаем работу и рассчитываем получить еще больший прирост в точности», — подчеркивает Михаил Криницкий.
Работа проводилась при поддержке программы «Приоритет 2030».