Атрибуция   /  Оценка качества классификации

Заключительным этапом процедуры распознавания должна стать оценка качества полученной классификации и проверка полученных классов на отсутствие артефактов. Оценка качества классификации основана на выявлении закономерностей для каждого класса, которые могут быть определены как подмножества из заданного множества параметров, значения которых одинаковы для большинства объектов анализируемого класса и отличаются от значений параметров других классов. Отсутствие подобных закономерностей свидетельствует о том, что данный класс не представляет собой однородного множества объектов.

Качество классификации считается тем выше, чем теснее расположены объекты внутри класса. Для минимизации разброса классифицируемых объектов введем такие качественные градации, как кластер и сгущение, которые позволяют определить, насколько тесно расположены объекты внутри класса по сравнению с расположением объектов внутри всей исходной совокупности. Для признания законченности процедуры распознавания необходимо добиться, во-первых, выполнения условия соответствия полученного разбиения на классы содержательному понятию кластера, и, во-вторых, условию, при котором полученный кластер может называться сгущением.


См. также полное описание оценки качества классификации в pdf


Оценка однородности состава априорных классов полностью подтвердила результаты, полученные в ходе детерминированного и вероятностного алгоритма распознавания для класса Ω1(Corneille), которому с разной степенью вероятности были атрибутированы 10 объектов. Что касается Ω2(Quinault), то по результатам проведенного анализа качества классификации из трех атрибутированных классу объектов лишь один объект, пьеса L'Étourdi может быть атрибутирована ему с вероятностью 0,68. Два других объекта формируют отдельный апостериорный класс Ω3, как не принадлежащие ни одному из априорных классов, но составляющие один класс, удовлетворяющий условиям кластера и сгущения.

   Представим полученные данные в виде матрицы решений, где 0- отказ от распознавания, 1- положительное решение по детерминированному алгоритму атрибуции, 1*- положительное решение по вероятностному алгоритму атрибуции.   

Матрица решений

Код

Наименование

Ω1

(Corneille)

Ω2

(Quinault)

Ω3

 

L'Étourdi ou Le Contre-Temps
Шалый, или Все невпопад

0

1*

0

Le dépit amoureux
Любовная досада

1

0

0

Sganarelle ou le cocu imaginaire
Сганарель, или Мнимый рогоносец

1*

0

0

Dom Garcie de Navarre,
ou Le Prince jaloux
Дон Гарсия Наваррский,
или Ревнивый принц

0

0

1*

L'École des maris
Школа мужей

1

0

0

Les Fâcheux
Докучные

1

0

0

L'École des femmes
Школа жен

1

0

0

La Princesse d'Élide
Принцесса Элиды
Части в стихах

0

0

1*

Tartuffe, ou L’imposteur
Тартюф, или Обманщик

1

0

0

10М

Le Misanthrope
Мизантроп

1*

0

0

11М

Mélicerte
Мелисерта

1*

0

0

12М

Pastorale comique
Комическая пастораль

1*

0

0

13М

Les Femmes savantes
Ученые женщины

1

0

0

>>> читать далее о выводах по результатам исследования

 

Полезные ссылки:
Авторы исследований
проф. Марусенко М.А.
Родионова Е.С.
Синелёва А.В.
Слаутина М.Ю.
Хозяинов С. А.
Чепига В.П.
Шувалова Е.Е.
Петрова A.Д.
Фотогалерея
Санкт-Петербургский государственный университет
©2009-2011 Все права защищены и принадлежат авторам сайта corneille-moliere.com
Использование любых материалов, опубликованных на данном сайте, возможно только при письменном разрешении авторов.
©2009 - 2011 Generatum Ltd.