Том 1 № 1 (2023): Промышленная кибернетика
DOI https://doi.org/10.18799/29495407/2023/1/14
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МОДЕЛЕЙ КЛАССИФИКАЦИИ ДЛЯ ОПРЕДЕЛЕНИЯ КАЧЕСТВА ВИНА ПО ЕГО ХИМИЧЕСКОМУ СОСТАВУ
Актуальность исследования обусловлена необходимостью решения проблем, связанных с контрафактной и некачественной продукцией в винодельческой отрасли. Несмотря на комплексную систему регулирования оборота алкогольной продукции, потребители всё же подвергаются риску неосознанного приобретения низкокачественных винных изделий. Недобросовестные производители приоритизируют снижение затрат перед обеспечением должного качества продукции, что негативно сказывается на общем потребительском опыте и подрывает репутацию более добросовестных производителей винных изделий. Последнее не способствует развитию конструктивной конкуренции на рынке и негативно сказывается как на рынке в целом, так и в части обеспечения интересов потребителя. В этом контексте исследовательская деятельность, направленная на автоматизированную объективную оценку качества вина по его
химическому составу с помощью методов машинного обучения, представляется актуальной. Создание инструментов, которые обеспечивают надежный и объективный способ отличить подлинные высококачественные вина от поддельных или низкокачественных аналогов, важно для обеспечения интересов потребителей и развития конструктивной конкуренции на рынке винных продуктов. Цель: создание системы для автоматизированной оценки качества вина по его химическому составу на основе модели классификации, обеспечивающей лучшее соответствие эталонному набору данных. Объекты: модели классификации, в числе которых метод опорных векторов, дерево решений, алгоритм случайного леса, нейронная сеть, множественная регрессия и их применение для автоматизированной оценки качества вина. Методы: методы машинного обучения для формирования моделей классификации; статистические методы для
оценки качества классификации и сравнения классификаторов. Результаты. С применением эталонного набора данных
«Wine_Quality_Data» сформированы пять альтернативных решений на основе распространённых моделей многоуровневой классификации. С использованием статистических критериев проведено их комплексное сравнение. Наилучшим решением, положенным в основу системы автоматизированной оценки, показало себя решение на основе модели случайного леса.
Ключевые слова:
модель классификации, качество вина, множественная регрессия, корреляционный анализ, машинное обучение