Основные параметры контроля коньяка — географическое происхождение и период выдержки. Они в значительной степени определяют себестоимость продукции и часто являются объектами фальсификации. Для оперативной классификации продукции по этим параметрам ученые МФТИ и ФГБУ «ВНИИОФИ» применили метод спектроскопии комбинационного (рамановского) рассеяния. В свою очередь, для обработки спектральных данных было разработано универсальное программное обеспечение, позволяющее провести качественный и количественный анализ с помощью алгоритмов машинного обучения. Результаты работы опубликованы в журнале Measurement Techniques.
К преимуществам комбинационного (рамановского) рассеяния относятся: простота пробоподготовки вплоть до ее полного отсутствия, высокая селективность, экспрессность и простота анализа. Наличие компактных приборов позволяет проводить анализ непосредственно на месте взятия пробы. Безусловно, существуют более точные методы определение состава многокомпонентных жидкостей, например жидкостная хроматография, но большинство методов анализа дорогостоящие и требуют от оператора особой подготовки.
В своей разработке ученые использовали программу на основе обработки данных с помощью методов хемометрики (математические методы изучения химических явлений) и машинного обучения. Уникальность программного обеспечения — в простоте использования. Пользователям не нужны дополнительные навыки программирования и глубокие знания в области хемометрики и машинного обучения. Программное обеспечение может использоваться как в составе программного обеспечения спектральных приборов, так и автономно на персональных компьютерах.
«На рынке довольно давно существует незаполненная ниша между универсальными пакетами, требующими специальной подготовки пользователей, и узкоспециализированными, ориентированными на ограниченный круг задач. Мы стремились заполнить эту нишу и предложили программное обеспечение, управление которым требует от пользователей лишь элементарной информированности о применяемых методах. При этом сама программа позволяет по фрагменту спектра образца установить его принадлежность к одному из заданных классов либо вычислить значения концентраций или долей компонентов на основе параметров спектра», — рассказал о проекте Александр Левин, ведущий научный сотрудник ФГБУ «ВНИИОФИ» и профессор МФТИ.
Применение этих методов позволяет существенно увеличить информацию, извлекаемую из спектров. Они хорошо себя зарекомендовали в биомедицинских исследованиях, при контроле качества пищевых продуктов, изделий химической и нефтехимической промышленности.
В ходе испытаний были измерены спектры комбинационного рассеяния света 42 образцов бренди и коньяков различного географического происхождения и сроков выдержки. Оказалось, что фрагменты спектров, измеренных в диапазоне комбинационных сдвигов 800–3000 см–1 являются наиболее информативными для решения поставленных задач. Корректность распознавания по географическому происхождению и сроку выдержки для неразбавленных образцов приближается к 100%.
«Это оперативный экспресс-анализ, но он позволяет определить подлинность продукции на основе различных нюансов — как спектральных, так и программных. Так, в Армении много молибдена в почве, а в России сравнительно мало. Дагестанский коньяк выдерживается в определенных дубовых бочках, и коньячный спирт делается из определенного сорта винограда, а армянский коньяк делается из другого сорта винограда. За счет этих различий спектры отличаются друг от друга. Однако эти различия могут быть не столь очевидны для человеческого глаза, поэтому мы и подключаем машинное обучение. Это позволяет сделать четкую классификацию и учесть даже незначительные отличия между образцами, если выбрать информативный диапазон спектров и провести правильно предварительную обработку данных. Обученная на многочисленных образцах модель машинного обучения быстро классифицирует образцы, в том числе и те, которые не использовались для обучения модели», — подытожил Арам Саакян, аспирант Физтех-школы электроники, фотоники и молекулярной физики МФТИ.