Примеры решения типовых задач icon

Примеры решения типовых задач



НазваниеПримеры решения типовых задач
страница4/4
Дата конвертации20.02.2013
Размер0.52 Mb.
ТипАнализ
1   2   3   4
3. Классификация на основе обычного евклидова расстояния и принципа «центра тяжести».

Так как мы используем обычное евклидово расстояние, то матрица R1 остается без изменения. Согласно агломеративному алгоритму объединяются в кластер S(4,5) объекты 4 и 5, как наиболее близкие 4,5 = 2,24.

Кластер S(4,5) характеризуется в дальнейшем его центром тяжести, определяемым вектором средних

Расстояние от этого кластера до первого наблюдения равно:



Тогда матрица расстояний примет вид:



Объединим объекты 1 и 2, расстояние между которыми 1,2 = 3,61 минимальное. Кластер характеризуется центром тяжести расстояния от которого до кластера S(4,5) равно:



Тогда матрица расстояний примет вид:



В матрице R3 минимальное расстояние (1,2),3 = 5,59, поэтому образуем кластер S(1,2,3) и определим его вектор средних

Найдем расстояние между S(1,2,3) и S(4,5)



на котором все пять объектов объединяются в один кластер. Графически результаты классификации представлены на рис. 4



Рис.4 Дендрограмма (обычное евклидово расстояние, принцип «центра тяжести»)

Из рис.4 видно, что наибольший скачок в расстояниях объединения  имеет место на последнем шаге, поэтому целесообразно выбрать разбиение на два кластера S(1,2,3) и S(4,5), что совпадает со случаем (1).

4. Классификация на основе обычного евклидова расстояния и принципа «средней связи».


Используя матрицу R1, согласно агломеративному алгоритму объединим кластеры S4 и S5 в один S(4,5), так как расстояние между ними 4,5 = 2,24 минимально.

Расстояние от кластера S(4,5) до остальных кластеров определим по принципу «средней связи» на основе матрицы R1. Например:



Тогда матрица расстояний примет вид:



Объединим, как наиболее близкие 1,2 = 3,61, кластеры S1 и S2. Тогда расстояние от S(1,2) до остальных кластеров S(4,5) равно:



а матрица расстояний имеет вид:



Объединим, как наиболее близкие (1,2),3 = 5,41, кластеры S(1,2) и S3 и определим расстояния от S(1,2,3) до S(4,5)



на котором все пять объектов объединились в один кластер. Графически результаты классификации представлены на рис. 5



Рис.5 Дендрограмма (обычное евклидово расстояние, принцип средней связи)

Анализ рис. 5 показывает, что целесообразным является разбиение на два кластера S(1,2,3) и S(4,5).

Таким образом, сравнивая результаты 4-х разбиений пяти регионов на однородные группы, можно отметить, что наиболее устойчивым, а отсюда и предпочтительным, является разбиение на два кластера S(1,2,3) и S(4,5), что согласуется с рис. 1. Только в одном случае из четырех, при использовании принципа «дальнего соседа» получено разбиение S(1,2) и S(3,4,5).

Во всех предыдущих алгоритмах классификации мы предполагали, что оба показателя х(1) и х(2) одинаково значимы (использовалось обычное евклидово расстояние). Теперь откажемся от этого предположения.

5. Классификация на основе «взвешенного евклидова расстояния» и принципа «ближайшего соседа».

Предположим, что показатель х(1) менее важен для классификации, чем х(2). В этой связи припишем им «веса» 1 = 0,05 и 2 = 0,9. Напомним, что взвешенное евклидово расстояние между i-м и l-м наблюдениями определяется по формуле:



Тогда расстояние между объектами 1 и 2 равно:



Аналогично находим все остальные расстояния и строим матрицу расстояний:



Объединим S2 и S3, имеющих минимальное расстояние 2,3=1,32 в кластер S2,3, и применив принцип «ближайшего соседа», получим матрицу расстояний:



Образовав на расстоянии 4,5 = l,96 кластер S4,5 вновь построим матрицу расстояний:



Объединим S1 и S4,5, имеющих минимальное расстояние (4,5)1 = 2,43, в кластер S(1,4,5) и получим матрицу расстояний



Следовательно на расстояние (1,4,5), (2,3) = 2,80 объединяются кластеры S(1,4,5) и S(2,3) и все пять объектов образуют один кластер.

Результаты классификации представлены графически на рис.6



Рис.6 Дендрограмма (взвешенное евклидово расстояние, принцип ближайшего соседа)

Как и прежде, отдадим предпочтение разбиению на два кластера; мы получаем третий вариант разбиения, а именно S(2,3) и S(1,4,5).

Таким образом, использовав пять алгоритмов кластерного анализа, мы получили три варианта разбиения пяти семей на две статистически однородные группы. С одной стороны это свидетельствует о гибкости (возможностях) методов кластерного анализа, а с другой- о необходимости использования экономических (содержательных) и статистических критериев для выбора наилучшего варианта классификации. При этом часто бывает полезной априорная информация об исследуемом явлении. В нашем примере, окончательно следует остановиться на разбиении S(1,2,3) и S(4,5), как наиболее устойчивом. Это разбиение получено по трем алгоритмам из пяти. Кроме того, оно согласуется с данными априорного, качественного анализа.
1   2   3   4




Похожие:

Примеры решения типовых задач iconДополнительные вопросы алгебры. Рекуррентные последовательности
Строится алгебра формальных рядов. В каждом разделе приведены решения типовых задач
Примеры решения типовых задач iconДокументи
1. /Решение задач/Контрольное задание ь1/Варианты для решения задач по теме ь1.doc
Примеры решения типовых задач iconДокументи
1. /Решение задач/Контрольное задание ь3/Варианты для решения задач по теме ь3.doc
Примеры решения типовых задач iconДокументи
1. /Решение задач/Контрольное задание ь1/Варианты для решения задач по теме ь1.doc
Примеры решения типовых задач iconАлгоритмизация и программирование Этапы решения задач на ЭВМ
Технология решения задач с помощью компьютера (моделирование, формализация, алгоритмизация, компьютерный эксперимент). Пример решения...
Примеры решения типовых задач iconПредисловие Цель предлагаемой работы — помочь тем, кто изучает дифференциальное исчисление, приобрести навык решения стандартных задач.
Рекомендуется перед выполнением индивидуальных заданий, ознакомиться с теорией и решением типовых примеров изложенных в данных методических...
Примеры решения типовых задач iconС. Л. Гладкий Л. Н. Ясницкий решение задач линейной термоупругости
Предложен аналитический метод решения линейных задач термоупругости. Дано краткое описание метода. Приведены частные решения плоских...
Примеры решения типовых задач iconУрок по математике 1 класс «Школа 2100». Закрепление. Цели и задачи: совершенствовать умение решать примеры на сложение и вычитание двузначных чисел без перехода через десяток
Закрепление решения задач двух видов. Решение уравнений с неизвестным вычитаемым, уменьшаемым и слагаемым
Примеры решения типовых задач iconТема урока «Координаты вектора. Решение задач с практическим содержанием»
Оборудование: таблицы (файлы) со схемами поиска решения задачи; карточки-информаторы (подсказки различного уровня энтропии); таблицы...
Примеры решения типовых задач iconПояснительная записка
В данном элективном курсе учащиеся обучаются методам решения задач с параметрами, начиная с самых простых линейных уравнений и неравенств...
Разместите кнопку на своём сайте:
Документы


База данных защищена авторским правом ©lib.podelise.ru 2000-2014
При копировании материала обязательно указание активной ссылки открытой для индексации.
обратиться к администрации
Документы

Разработка сайта — Веб студия Адаманов