Главная > Оптика > Оптические вычисления
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.3.2. Проблемы разработки систем и возможности их приборной реализации

На пути создания успешно работающего оптического умножителя матриц возникает большое число различных проблем. Задача может быть условно разделена на проблемы, связанные с оптической частью, и проблемы, связанные с электронной частью. Проблемы оптических устройств, рассматриваемые здесь, затрагивают в основном вопросы подбора источников света для выходного сигнала, пространственных модуляторов света и фотодетекторов выходного сигнала. Проблемы, связанные с электронными устройствами, включают передачу данных на световые источники и модуляторы, а также восстановление данных, поступающих с детекторов. Эти проблемы настолько

обширны, что не могут быть здесь рассмотрены. Приборные решения также зависят от доступной технологии, которая в свою очередь сама быстро развивается. Следует только упомянуть две проблемы, наиболее тесно связанные с оптикой. Первая — это скорость передачи данных. Для определенности будем полагать, что электронные схемы передают информацию со скоростями около бит/с (что будет соответствовать мегагерцевым частотам). Такая скорость обработки совместима с интегральными схемами со сверхвысокой степенью интеграции (СБИС). Любой источник света, фотодетектор или модулятор должны устойчиво работать с такой скоростью. При обсуждении полосы пропускания будет использоваться эмпирическое соотношение, согласно которому ширина полосы частот должна быть в четыре раза больше скорости передачи ранных. Теорема Уиттекера — Шеннона требует различия этих параметров минимально в два раза, так что коэффициент 4 создает «резерв» для большей надежности на случай пиковых изменений уровня сигнала. Коэффициент 10 определяется результатами более жестких оценок, полученных из общих соображений, но далее будет показано, что и меньший множитель является приемлемым. Также было сделано предположение, что электронные схемы могут передавать данные по необходимости либо в последовательном, либо в параллельном виде. На практике возможная степень параллельности обработки может быть ограничена. Как показано ниже, это жестко ограничивает возможности двумерных процессоров, вычисляющих внешнее произведение.

Другая проблема, являющаяся гораздо более жесткой, заключается в необходимости для аналого-цифрового преобразователя (АЦП) отслеживать сигнал с фотодетекторов. Так как оптический выходной сигнал записан в смешанном формате, он должен быть преобразован в чисто двоичный код, прежде чем он будет использован в дальнейших расчетах. В целом для двоичных чисел с длиной в I цифр АЦП должен различать I различных уровней. При этом процесс аналого-цифрового преобразования, несомненно, потребляет энергию и может являться самым медленным процессом в цикле обработки сигнала. В целом требования к ширине полосы частот источников и детекторов не являются жесткими. Согласно указанному эмпирическому правилу, если частота передачи данных равна то источники и фотодетекторы должны обладать полосой в Некоторые из архитектур удовлетворяют требованиям либо к детекторам, либо к источникам (но не обоим одновременно). Архитектуры с пространственным интегрированием дают возможность

использовать медленное переключение источников из одного состояния в другое со скоростью в то время как детекторы должны отслеживать все тактовые циклы. Наоборот, архитектуры с временным интегрированием нуждаются в источниках света, переключающихся в каждом тактовом цикле, и детекторах, интегрирующих по циклам. Всегда могут обнаружиться архитектуры, требующие переключения и источника, и детектора в каждом тактовом цикле.

Влияние полосы пропускания детектора на вычислительные возможности описывается фактором качества, получившим известность как отношение Псалтиса [21]. Отношение Псалтиса представляет собой число операций умножения, приходящихся на одно аналого-цифровое преобразование, которое может выполнять вычислительное устройство. Желательно, чтобы этот параметр имел значение более 1. Указанную величину обычно вычисляют путем деления числа операций умножения в секунду (скорость вычислений) на число аналого-цифровых преобразований в секунду (число выходных каналов, умноженное на полосу пропускания канала). Поскольку скорость вычислений зависит от ширины полосы частот входного сигнала, а ширина полосы частот как входного, так и выходного сигналов связана с общей тактовой частотой то отношение Псалтиса не зависит от тактовой частоты. Отсюда вычислительные возможности не могут быть увеличены за счет увеличения частоты работы вычислительного устройства.

Быстродействие оптических матричных умножителей было уже описано в табл. 7.1 и 7.2. При вычислении отношения Псалтиса числа в табл. 7.1 и 7.2 имеют «коэффициент запаса» 2, поскольку были учтены операции умножения и сложения. Для умножителей матриц на векторы соотношение Псалтиса показано в табл. 7.3. Умножители матрицы на матрицы показаны в табл. 7.4. Вычисления проведены для тех же случаев, что и в табл. 7.1 и 7.2. Второй столбец табл. 7.3 предполагает значение в то время как для третьего столбца . В табл. 7.4 второй столбец соответствует значениям а третий столбец относится к

Таблицы 7.3 и 7.4 демонстрируют прямо-таки ужасающую неэффективность работы аналого-цифрового преобразователя. По мере увеличения размеров матриц отношение Псалтиса резко спадает. Единственной архитектурой, для которой отношение Псалтиса еще как-то приближается к 1, является двумерная архитектура вычисления внешнего произведения. Архитектура этого вида в наибольшей степени использует преимущества двумерной природы распространения света.

Альтернативный подход к проблеме увеличения отношения Псалтиса был предложен в Авторы этой работы

предложили вариант архитектуры с временным интегрированием, в котором операция сдвига выполняется в фотодетекторе, а не во входном регистре. Рассмотрим рис. 7.2: число вводится в сдвиговый регистр не в виде временной последовательности сигналов, а представлено в виде неподвижной маски (транспаранта) на протяжении всех операций процедуры вычислений. Фотодетектором служит ПЗСсдвиговый регистр, который смещается и суммирует свое содержимое на каждом шаге. Для обработки входного сигнала требуются буферные разряды, поскольку при точности входного сигнала I цифр результат имеет длину 21—1 цифр. Буферы входного сигнала позволяют выделить время на очистку сдвигового регистра от сигнала. Они также позволяют выделить время на загрузку входного модулятора следующим набором цифр. Входной модулятор, используемый в данном случае, аналогичен модуляторам, применяемым в архитектуре вычислений внешнего произведения, в том плане, что цифры должны быть введены за один тактовый цикл, а не загружаться постепенно, как в случае стандартной архитектуры с временным интегрированием.

Для реализации умножения вектора на вектор ряд таких модуляторов соединяют вместе по одному на каждый элемент вектора. Выходные сигналы суммируются на одном детекторе, как в архитектуре 2М ВИ (II). Но в отличие от случая умножителя вектора на матрицу, применяющего комбинацию узлов умножителя вектора на вектор, этот процессор использует один умножитель вектора на матрицу, но пропускает всю матрицу через него синхронно с тактовыми импульсами. Архитектура требует циклов для умножения матрицы на вектор Как и в случае архитектуры 2М ВИ (II) зависимость от отражается на требованиях к динамическому диапазону детектора. Соответственно затраты времени на операцию умножения и рабочие частоты будут такими же, как для случая архитектуры 2МВИ(П), показанной в табл. 7.1. Однако в данном случае имеется только один выходной канал, в котором аналого-цифровое преобразование должно выполняться в каждом тактовом цикле. В результате (как видно из табл. 7.3), отношение Псалтиса для первой тестовой задачи составляет 1,032 и соответственно 2,032 — для второй.

Умножитель вектора на вектор позволил достичь желаемого отношения Псалтиса за счет двух обстоятельств. Во-первых, использовался модулятор, не требующий последовательной загрузки данных, что позволяет сократить время загрузки. Во-вторых, в последнем случае намеренно ограничено до минимума число оптических операций. Параллелизм обычно рассматривается как главное преимущество оптики, но единственный путь увеличения отношения Псалтиса для оптической системы состоит в уменьшении степени параллелизма.

Сведением этой идеи до абсурда является одноразрядный умножитель, через который вся задача пропускается строго последовательным образом. Однако в этом случае умножитель становится узким местом, ограничивающим работу всей системы. Урок, который следует извлечь из этого, состоит в том, что для эффективной работы (описываемой отношением Псалтиса), параллелизм должен быть принесен в жертву в уплату за использование аналого-цифрового преобразователя.

Физическая реализация источников и детекторов частот представляет собой более сложную проблему, чем обеспечение требуемой ширины полосы частот. В то время как одномерные и двумерные матричные детекторы стали широко распространенными устройствами уже на протяжении ряда лет, матричные излучатели еще не стали таковыми. Если уменьшить до минимума число детекторов, то тогда архитектура типа 2МВИ(II), требующая использования матричных источников, выглядит в настоящий момент вполне реализуемой. При этом конечный размер детектирующих элементов и источников также представляет проблему для интерфейсных элементов. В то время как активная область источника, модулятора или детектора может составлять лишь несколько микрон, из-за наличия шин управления активной областью детектор обычно имеет существенно большую площадь. В результате отдельные ячейки фотодетектора обычно имеют размер в несколько десятков микрон.

Из-за расхождения в размерах и наличия определенной пространственной конфигурации дискретные элементы не могут быть скомбинированы в матричные устройства. Межэлементные соединения обычно требуют управления с помощью анаморфных преобразований изображений и оптического преобразования Фурье. Если размеры ячеек составляют порядка 100 мкм, оптика обеспечивает хорошее качество изображения на расстояниях, равных или меньших При уменьшении размеров ячейки или по мере увеличения необходимого усиления, требуемого для согласования компонент, требования к величине становятся более строгими. Многие архитектуры требуют использования сегментированной оптики или матриц линз. Матрицы голографических линз могут снять остроту некоторых проблем изготовления. Другая возможность, если позволяют размеры ячеек, состоит в использовании волоконной оптики для соединения ячеек модулятора с элементами детектора. (Возможно, курьезом выглядит тот факт, что, для того чтобы воспользоваться преимуществом оптики при реализации большего быстродействия, приходится отказаться от безынтерференционного распространения волн в системе.)

Электрооптические модуляторы представляют собой весьма быстроразвивающуюся область, рассматривая которую трудно избежать устаревания информации. В числе подходов,

предложенных для реализации различных архитектур, находятся акустооптические ячейки [23], интегрально-оптические дифракционные решетки [24], устройства на поверхностных акустических волнах [25] и магнитооптические модуляторы [26]. Некоторые из архитектур требуют использования еще не существующих видов модуляторов.

Двумерные модуляторы, хотя и не проработаны на высоком уровне, однако очень просты для применения в оптических компьютерах, о чем свидетельствуют параметры архитектуры 2М ВП. В этом случае модуляторы имеют сравнительно большие размеры ячеек (около 100 мкм или более) и ограниченные полосы пространственных частот. Максимальный размер таких модуляторов редко превышает 256x256 адресуемых ячеек. Этот предел имеет важные последствия для архитектур, требующих параллельного ввода в модулятор всех цифр. В частности, отсюда следует, что процессоры, вычисляющие внешнее произведение, исключительно точно «попадают в цель». Например, при точности вычислений в 32 бита (как в табл. 7.2) модулятор может выполнять процедуры только с 8 числами. Если провести разбиение матрицы 128x128 на подматрицы 8x8, то для решения задачи процессор теперь должен выполнять 16x16 = 256 последовательных операции умножения матриц. Скорость вычислений уменьшается с до что несколько лучше, чем у других умножителей матрицы на матрицу.

В большинстве одномерных модуляторов применяются дифракционные решетки с модулированным профилем, т. е. каждый бит переносится на несущей частоте. Следовательно, согласно эмпирическому правилу, несущая частота должна быть и 4 раза выше, чем тактовая частота. Число цифр, которое может быть размещено в дифракционном модуляторе, эквивалентно тактовой частоте, умноженной на быстродействие ячейки, или где — быстродействие ячейки, частота модуляции. Это эквивалентно утверждению, что каждый бит четыре раза представлен несущей частотой. Акустооптические модуляторы обычно имеют произведение достигающее 2000, так что акустооптические модуляторы могут содержать в себе одновременно до 500 цифр. Важно согласовать тактовую частоту с частотой, на которой работает сам модулятор. Если используется тактовая частота в 10 МГц, и для ГГц ячейки тогда в ячейке будут содержаться только 20 цифр.

Если модулятор можно модулировать по частоте, то ситуация оказывается несколько более сложной. Модулятор, работающий на частоте имеет полосу частот в что вытекает из «теоремы выборки» (сигнал захватывается несущей частотой дважды за цикл). Для простоты далее будем полагать, что в этом диапазоне частот частотная характеристика оказывается

монотонной. Чтобы разделить строк матрицы, требуется разделить полосу частот на поддиапазонов с шириной Глубина модуляции в каждом из поддиапазонов не может превышать Согласно приведенному выше правилу «четверки», временной интервал, занимаемый одним битом в ячейке, должен составлять не менее чем что является обратной величиной к одной четвертой части ширины полосы частот. Если временная апертура ячейки составляет полное число бит, которое может загружаться в ячейку, составляет что равняется точности представления числа. Полагая где — время стробирования ячейки, получаем соотношение Если, как и в предыдущем примере, тогда Чтобы сохранить величина ограничена значением 15. Для сравнения укажем, что на основе анализа дифракционных процессов авторы [23] получили предельное значение Проведенный ими анализ частотных характеристик дает более жесткое ограничение величины — в 4 раза.

<< Предыдущий параграф Следующий параграф >>
Оглавление