Главная > Интеллектуальные системы > Искусственный интеллект (Э. Хант)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.5. Группирование

4.5.0. Задача группирования

В распознавании образов должна быть известна принадлежность классам по крайней мере некоторых объектов. Задача состоит в нахождении такого правила, которое позволило бы установить эту принадлежность. В близкой задаче — задаче группирования — именно устройство классификации должно решить, какие объекты следует сгруппировать. Задачи группирования встречаются во многих областях. В медицине самые разнообразные болезни, вызываемые различными микроорганизмами, нередко группируются под общими названиями, например, „простудный катар" или „кишечное расстройство". В психиатрии классификация психических расстройств на „шизофрению", „маниакально-депрессивный психоз" и „психопатию" не настолько отчетлива, как хотелось бы. В биологии проблема группирования имеет интересную особенность. Обычно предполагается, что объединение видов в семейства

и роды отражает общность происхождения. По традиции о линиях эволюции судят по нескольким произвольно выбранным общим признакам, но в последнее время были предложены численные методы, подобные некоторым из обсуждаемых ниже, как более подходящие для выяснения таксономических отношений (Сокаль и Снит, 1963). В искусственном интеллекте задача группирования изучалась под названием „обучение без учителя". Хорошей иллюстрацией может служить дешифровка. Допустим, что получено закодированное сообщение, причем каждая буква алфавита может иметь несколько разных кодов. Например, буква могла быть написана как или Задача состоит в приписывании кодов данного сообщения соответствующим им буквам. Задача выглядит более подходящей для решения с помощью ЭВМ, чем упомянутые выше задачи классификации болезней или таксономия, хотя с формальной точки зрения они схожи.

Мейзел (1972) предложил три характеристики, которыми можно описать алгоритмы группирования.

1. Существует ли критерий, по которому можно оценить результат группирования, или следует проверять процедуру группирования с точки зрения ее разумности? В первом случае метод группирования называют непрямым., поскольку он возникает как побочный эффект попытки минимизации или максимизации некоторой функции; во втором случае метод группирования называют прямым.

2. Независимы ли группы, которые должны быть выделены, или предполагается, что они образуют некоторую иерархию, как в таксономии?

3. Какая задача интересует прежде всего: установление принадлежности экспериментальных точек определенным группам или вычисление параметров функции, по которой по предположению порождаются данные?

Известно много алгоритмов, которые можно считать процедурами группирования. Мы не сможем охватить их все. Вместо этого приведем три иллюстративных метода: первый заключается в оценке функций, порождающих данные, с помощью непрямого группирования, второй — неиерархический метод и третий — иерархический прямой метод группирования. Другие алгоритмы можно найти в работе Дуды и Харта (1973).

<< Предыдущий параграф Следующий параграф >>
Оглавление