Главная > Разное > Применение цифровой обработки сигналов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2.7.3. Неопределенная инверсная свертка

Подавление нежелательных эхо-сигналов оказалось возможным потому, что свойства одного из разделяемых сигналов были известны с абсолютной точностью. В основе фильтрации лежат сведения о распределении кепстра музыки или о задержке эхо-сигнала. Однако часто бывает, что характеристики обоих сигналов; неизвестны или известны лишь частично, по сигналы нужно разделить между собой. Подобная задача называется неопределенной инверсной сверткой (или инверсной фильтрацией «вслепую»), так как в этом случае требуется устранить влияние на неизвестный сигнал фильтра с неизвестными характеристиками, когда имеется только искаженный сигнал.

Стокхэм [119] использовал методику неопределенной инверсной свертки для восстановления старых звукозаписей. При этом не были точно известны ни записываемый музыкальный сигнал, ни форма передаточной характеристики записывающего устройства. В распоряжении экспериментатора была только шеллачная грампластинка. Стокхэм заметил, что старые записи звучат не очень естественно, и объяснил это влиянием острых резонансов механической записывающей системы. Все элементы звукозаписывающего тракта, начиная от рупора и кончая мембраной с закрепленной на ней иглой, имеют заметные резонансы; более подробное описание старых звукозаписывающих устройств можно найти в работе [118]. Наличие резонансов было, вероятно, связано с необходимостью снижения потерь на трение, чтобы поднять до максимума уровень выходного сигнала. Хотя частотную характеристику можно было сделать более равномерной, основной целью было получение максимального отношения сигнал/шум.

Эти резонансы создают в частотной характеристике очень большие пики и провалы, особенно вблизи частоты Амплитуда этих выбросов может доходить до 20 дБ, а их ширина достаточно

велика. Это создает весьма заметное окрашивание спектра музыки. Неравномерность частотной характеристики не очень заметна, если пики имеют небольшую ширину. Так, за счет реверберации создаются очень резкие пики и провалы, но ширина их обычно не превышает 1 Гц или даже долей герца. Резонансы в системе механической звукозаписи могут иметь ширину до 10—50 Гц. Если голос певца пересекает одни из таких резонансов, то сила звука изменяется очень резко. Таким образом, кроме «окрашивания» спектра процесс звукозаписи вносит очень сложные изменения в динамику музыкального произведения. Характерное звучание старых записей в большей степени связано с резонансами, чем с повышенным уровнем шума или с недостаточной шириной полосы записанного сигнала.

Чтобы устранить влияние фильтра, характеристики которого неизвестны, необходимо сделать предположение о свойствах сигнала или фильтра, или о том и другом. При анализе звукозаписей целесообразно сделать два основных предположения. Во-первых, следует считать, что характеристики фильтра линейны и не изменяются в течение всей записи. Это предположение, по-видимому, справедливо почти всегда, хотя частотная характеристика может слегка изменяться за счет небольших смещений рта певца относительно рупора фонографа. Тем не менее спектральный состав голоса исполнителя на протяжении музыкальной фразы остается сравнительно постоянным, и в среднем спектр мужского голоса при исполнении одной и той же части произведения вряд ли изменился с 1906 г. Во-вторых, следует предположить, что длина музыкального отрывка гораздо больше длительности импульсного отклика «фильтра, а это позволяет проводить усреднение, что необходимо для выделения сигнала. При инверсной фильтрации всегда необходимо иметь какие-либо сведения о сигнале и искажающем фильтре. Так, например, если имеется единственная запись, полученная с помощью некоторого совершенно нового музыкального инструмента, то провести инверсную фильтрацию невозможно.

Для иллюстрации этого процесса рассмотрим работы Стокхэма по восстановлению старых записей выступлений Карузо, сделанных в 1906 г. Инверсная фильтрация основывается на гомоморфной обработке сигналов; здесь применяются те же операции, что и при ослаблении эхо-сигналов. Пусть — записанный сигнал, s(t) — записываемая мелодия, a h(t) — импульсный отклик системы записи. Тогда

Преобразование Фурье обеих частей этого равенства имеет вид

а комплексные логарифмы правой и левой частей соотношения (2.8) связаны равенством

которое обладает свойством аддитивности. Желательно найти такое линейное преобразование, с помощью которого из последнего равенства можно определить точный вид Если эта функция известна, на ее основе можно создать обратный фильтр, устраняющий внесенное в процессе записи окрашивание спектра. Если бы спектры двух слагаемых правой части равенства (2.9) заметно различались, то их можно было бы разделить путем линейной, фильтрации, как это было сделано при подавлении эхо-сигналов. Но в данном случае основные спектральные составляющие лежат в одном и том же диапазоне, а именно между и 1000 Гц.

Однако не изменяется в течение всей записи, непрерывно флуктуирует. Этот факт подсказывает, что всю запись можно разделить на большое число участков длиной, превышающей длину импульсного отклика записывающей системы, и путем усреднения по всем участкам оценить характеристики фильтра. В сумме (2.9) слагаемое на всех участках одинаково, а слагаемое изменяется. Для анализа следует брать запись, сделанную в один прием, так как в следующем сеансе записи могли быть изменены регулировки фонографа или взят другой: аппарат.

Равенство (2.9) для участка имеет вид

При усреднении необходимо учесть, что в соотношениях (2.9) — (2.10) фигурируют комплексные функции и следует усреднять по отдельности их модули и аргументы. Среднее значение модуля равно

а среднее значение аргумента

Левую часть соотношения (2.11) можно оценить экспериментально и из нее получить оценку если каким-то образом удастся найти оценку второго слагаемого правой части. Это слагаемое является оценкой спектральной плотности, характерной для голоса данного певца. Его аппроксимацию можно найти, если;

подвергнуть такой же обработке современную запись. В результате получается следующее уравнение, эквивалентное (2.11):

где , поскольку современные звукозаписывающие аппараты не окрашивают спектров. Разность между соотношениями (2.11) и (2.13) равна

т. е. дает оценку модуля Предположение о том, что средние спектры голосов двух певцов при исполнении одного и того же «отрывка арии будут одинаковыми, по всей видимости, является разумным. При этом любые ошибки будут создавать слабое окрашивание спектра, подобное тому, что получается при неправильной установке регуляторов тембра. Экспериментальные данные, соответствующие соотношению (2.11), приведены на рис. 2.32, а результаты сглаживания современной записи — на рис. 2.33.

Разность между этими функциями была взята в качестве оценки Практически такой процесс дает только приближение к так как характеристики фильтра, получаемые при обработке современных записей, содержат заметные пики и провалы, которые нельзя отнести ни к особенностям среднего спектра голоса, ни к окрашиванию в процессе записи. В спектре наблюдаются гармоники частоты электросети, появляющиеся, по-видимому, из-за несовершенства блоков питания современной звукозаписывающей аппаратуры. Тем не менее данный метод является достаточно точным и позволяет заметно повысить качество записи. По сообщениям Стокхэма, исправленные записи выступлений Энрико Карузо «звучат несколько неестественно, но ясность выражений, текстура голоса и художественное впечатление очень сильно улучшились». При обработке удалось устранить изменения силы звука, связанные с резонансными явлениями, и в записи исчез «мегафонный» оттенок звука.

Компенсирующий фильтр был построен на основе обращения модуля фазовая информация при этом не использовалась .из-за математических трудностей, связанных с усреднением фаз, входящих в равенство (2.12). Эти трудности обусловлены тем, что для усреднения необходимо иметь истинные значения фаз, а не главные значения. Главное значение средней фазы не равно среднему от главных значений. Так, например, среднее для углов и 370° равно 185°, однако если угол 370° представить его главным значением, равным 10°, то среднее будет равно 5°. Из-за сложности вычислений Стокхэму не удалось найти для

(кликните для просмотра скана)

фазовой функции, хотя подобная задача рассматривалась в литературе [116, 117]. Причиной, позволяющей отбросить фазовую компенсацию, является нечувствительность человеческого слуха к фазовым ошибкам. Однако фактические пределы восприятия фазы пока что не выяснены, и какая-то доля остаточного окрашивания, прослушивающегося в восстановленных записях, может быть связана именно с этим эффектом.

Даже при использовании самых быстродействующих современных ЦВМ расчеты, необходимые для восстановления записей, занимают очень много времени. Обработка записи длиной в несколько минут может длиться несколько часов. Музыкальный сигнал необходимо разделить на отдельные отрывки и каждый из них перевести в спектральную область с помощью БПФ. Число отрывков доходит до 500, поэтому для определения параметров фильтра приходится усреднять 500 логарифмов от спектров, полученных после БПФ. Структура фильтра настолько сложная, что обработку музыки выполняют в частотной области, для чего музыку подвергают преобразованию Фурье и умножают ее спектр на коэффициенты передачи обратного фильтра. Объем необходимых вычислительных операций вынуждает проводить такую обработку только в стенах научного учреждения. Тем не менее результаты получаются очень впечатляющими. Благоприятная реакция слушателей свидетельствует об эффективности восстановления записей.

<< Предыдущий параграф Следующий параграф >>
Оглавление