А. В. Новиков
Московский физико-технический институт
Под классификацией понимают разделение рассматриваемой совокупности объектов или явлений на однородные (в определённом смысле) группы. Полученные в результате разбиения классы часто называют кластерами (таксонами, образами), а методы их нахождения соответственно кластер-анализом.
В работе изложены основные понятия, используемые в методах классификации без обучения. Дан обзор типов применяемых метрик в пространстве данных и описаны функционалы качества разбиения. Описан алгоритм кластеризации с использованием адаптивной метрики.
Результатом работы является программа общего назначения с ясным графическим интерфейсом, которая способна производить кластер-анализ любых данных методом k-средних с адаптивной метрикой. В качестве иллюстративного примера программой было проанализировано 1 000 стандартных профилей NASA, с целью выявления корреляций между их формой и аэродинамическими характеристиками.
Профили, заданные своей геометрической формой (60 точек по периметру), были разбиты на 2 кластера (класса). После сопоставления каждому профилю его аэродинамических характеристик были построены следующие гистограммы:
Рис.1 Распределение максимального по
для профилей в 2 разных классах
Рис.2 Распределение поперечного момента для профилей в 2 классах
Хотя разделение профилей на кластеры проводилось только по их геометрии, видно, что получена, в общем, классификация по их аэродинамическим характеристикам. Таким образом, форма аэродинамического профиля сама по себе содержит информацию о некоторых (дозвуковых) аэродинамических параметрах, которые можно оценить, не решая никаких уравнений. Такие оценки можно использовать как предварительную обработку данных перед точными вычислениями.
Литература
- Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. – М.: Финансы и статистика, 1989.
- Дюран Б., Оделл П. Кластерный анализ. – М.: Статистика, 1977.

