Главная > Интеллектуальные системы > Искусственный интеллект (Э. Хант)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.0.2. Предположение об евклидовости пространства

Все обсуждаемые в этой главе процедуры зависят от понятия расстояния между двумя точками в пространстве описаний. Грубо говоря, используется следующее соображение: если два объекта имеют описания, расположенные близко друг от друга в пространстве то они скорее всего принадлежат одному классу. В гл. 3 указывалось, что такой подход интуитивно справедлив для большинства физических шкал, таких, как рост и вес, но менее пригоден, если описание основано на присутствии или отсутствии каких-то признаков. Эту тему можно развить дальше и показать, какие именно свойства самих описывающих измерений вытекают из предположения о существовании расстояния.

Пусть будет -мерным пространством описаний. Точка определяется -мерным вектором Расстояние между двумя точками х и у в равно

Отсюда ясно, что расстояние между двумя точками зависит от их относительного расположения в а не от абсолютного местонахождения каждой. Точнее, точки удалены друг от друга на то же расстояние, что и точки если

Равенство (2) показывает, что имеет смысл сравнивать измерения по каждой шкале в отдельности. Шкала, для которой это можно сделать, называется шкалой интервалов. Примером шкалы интервалов может служить время, поскольку утверждение типа «отрезок времени между минутами не зависит от значения z» имеет смысл. Вес и рост также являются шкалами интервалов, а на

самом деле они могут удовлетворять и более строгим предположениям. С другой стороны, много интересных шкал не обладают свойствами шкалы интервалов. Например, твердость определяется отношением «х тверже у, если х царапает у». По этой шкале алмазы тверже стекла, а стекло тверже сливочного масла. Твердость служит примером шкалы порядка, поскольку ее можно использовать для того, чтобы приписать объектам числа, отражающие лишь некоторое упорядочение, а не обязательно свойство равных интервалов. Ясно, что равенство (2) было бы бессмысленным для твердости.

Шкалы интервалов инвариантны относительно линейных преобразований. Это означает, что можно заменить пространство описаний новым пространством таким, что точка отображается в точку по формуле

и эта замена не скажется на результатах последующего анализа выборки.

Существуют шкалы более сильные, чем шкалы интервалов, и шкалы более слабые. Мы уже упоминали шкалы порядка. В абсолютных шкалах помимо интервального свойства указывается еще единица и нулевая точка. Примером может служить шенноновская мера информации. На другом конце шкалы шкал находится распределение номеров по телефонным аппаратам, которое представляет собой шкалу наименований — номера отождествляют аппараты, но не отражают никакого их физического свойства. Мы отсылаем интересующегося читателя к книге Кумбса, Дойеса и Тверского (1970), где кратко излагается рассматриваемая проблема, и к работам Суппеса и Зинеса (1963) и Кранца и др. (1971), где эта проблема обсуждается более основательно. Цель обсуждения шкал здесь двояка:

(1) оправдать те преобразования пространства описаний, которые будут использоваться в последующих разделах главы, и (2) дать читателю представление о фундаментальном предположении, лежащем в основе любого рассуждения, связанного с классификацией образов с использованием расстояния.

<< Предыдущий параграф Следующий параграф >>
Оглавление