Главная > Разное > Применение цифровой обработки сигналов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2.2.6. Психоакустические факторы

Качество работы различных преобразователей трудно сравнивать аналитически, поэтому полезно провести такое сравнение психоакустическими методами. Определив необходимую скорость создания информации для гипотетического преобразователя, согласованного со свойствами человеческого слуха, можно оценить, насколько обычные аналого-цифровые преобразователи отличаются от идеального. Это отличие определяет показатель, который часто применяют для оценки качества речевых систем. Можно например, задать вопрос: чему равна скорость создания информации в преобразователе, идеально согласованном с человеческой слуховой системой? Этот вопрос можно рассматривать как относительно всех звуковых сигналов, полностью перекрывающих динамический и частотный диапазоны слуха, так и применительно к более узкому кругу сигналов, называемых обычной музыкой. В обоих случаях оптимальным будет преобразователь, который создает минимум ошибок, замечаемых человеком. Музыка представляет собой класс ограниченных звуковых сигналов, поскольку она создается при возбуждении механических резонансов или имеет вид ограниченных во времени ударных звуков. Преобразователь, предназначенный для широкого класса всех звуковых сигналов, даст, конечно, более универсальные результаты, но при проектировании звуковоспроизводящих систем широкого назначения обычно стараются сохранить их стоимость в разумных пределах.

Оптимальным является преобразователь, у которого скорость создания информации уменьшена до такого минимального значения, при котором различие между квантованным и

неквантовандым сигналами не воспринимается на слух. Для достижения этой цели необходимо глубокое понимание психоакустических эффектов, создаваемых различными видами ошибок преобразования. К сожалению, полной модели слухового восприятия не существует, а есть лишь обширная литература по этим вопросам, где описываются различные явления.

При изучении кодирования звуковых сигналов наиболее полезными являются исследования, посвященные обнаружению сигналов в различных условиях [16, 82]. Вообще для каждой частоты акустического сигнала существует определенный уровень, ниже которого он не слышен. В присутствии другого сигнала этот порог значительно повышается. В первом случае (без мешающего сигнала) определяется такой абсолютный порог слышимости, что звук заданной частоты с уровнем, не превышающим этого порога, совершенно не слышен. На рис. 2.6 показаны пороговые уровни для людей с нормальным слухом [124]. Из приведенных кривых видно, что область наибольшей чувствительности слуха занимает диапазон от 1 до 5 кГц. На более высоких частотах чувствительность слуха уменьшается, и на частоте 15 кГц она на 20 дБ меньше максимальной. Аналогично возрастает порог чувствительности на низких частотах. Во втором случае имеет место маскировка сигнала, когда присутствие одного звука затрудняет восприятие другого звука. При этом происходит сдвиг порога восприятия. Если звучат длинные периодические сигналы, то звук с данной частотой маскирует сигналы на соседних частотах и делает их совершенно неслышными. Кратковременные ударные звуки заглушают сигналы, звучащие до и после соответствующего переходного процесса. В обоих случаях звуковой сигнал может полностью заглушить как шум квантования, так и другие звуковые сигналы. Это позволяет при разработке АЦП игнорировать те сигналы, которые будут замаскированы, а также не обращать внимания на шум квантования, возникающий в АЦП, если он не будет слышен на фоне полезного сигнала.

На рис. 2.7 приведены результаты экспериментов по маскировке сигналов в частотной области [18]. Группе людей давали возможность слушать звуковой сигнал на фоне синусоидального колебания частоты 1200 Гц с уровнем звукового давления (УЗД), равным 80 дБ. Частота и амплитуда контрольного тона изменялись, чтобы найти область, в которой он не воспринимается. На графике эта область отмечена словами «только помеха». В ней происходит полная маскировка и слышен только звук с частотой 1200 Гц. Вне этой области контрольный сигнал прослушивается как отдельный тон или в виде биений.

Если маскирующий тон заменяется на узкополосный шум [19], то получается несколько иной результат (рис. 2.8). Для музыки такой вид сигнала более характерен, чем одночастотный чистый тон. Из представленных на рис. 2.8 кривых видно, что область

(кликните для просмотра скана)

спектра, в которой наблюдается маскировка, в сильной степени зависит от амплитуды заглушающего сигнала. Чем больше его амплитуда, тем шире диапазон маскировки. Обширные сведения о маскировке при различных сочетаниях свойств заглушающего (маскирующего) и контрольного сигналов приведены в работе [82].

Другим важным явлением является маскировка во временной области. В этом случае помехи могут помешать восприятию более слабого сигнала, звучащего примерно в это же время. Если громкий звук маскирует следующий за ним слабый звук, то явление называется маскировкой вперед; оно может продолжаться до 250 мс. Границы областей маскировки (рис. 2.9) в логарифмическом масштабе изображаются линиями, близкими к прямым [17]. Громкий звук может также маскировать звук, воспроизводимый до него; это явление называется маскировкой назад, его длительность составляет ~20 мс [125].

Из вышеприведенных результатов следует, что для узкополосных сигналов необходимое отношение сигнал/шум составляет лишь дБ. Предположим, например, что входной сигнал Пропущен через гребенку полосовых фильтров и верхний сигнал каждого фильтра преобразован в цифровую форму. Требования к , следовательно, число разрядов, необходимое в каждом АЦП, определяются условиями различимости шума, находящегося в полосе каждого фильтра. Из рис. 2.8 видно, что в присутствии сигнала с уровнем 80 дБ в такой узкой полосе будет полностью заглушен любой сигнал или шум с уровнем, не превышающим 50 дБ. Поэтому для достижения заданного отношения в-принципе требуется только шесть разрядов. Проблему обеспечения динамического диапазона в каждой из частотных полос можно решить с помощью какой-либо методики преобразования с поблочно плавающей запятой, описанной ранее. Длительность отклика системы с плавающей запятой определяется временем маскировки вперед, которое сравнительно велико. Поэтому условие получения большого не очень влияет на выбор скорости создания информации. Ширина этих частотных поддиапазонов, называемых критическими полосами, увеличивается с ростом частоты [87]. Критические полосы имеют ширину Гц на частотах до 1 кГц и расширяются постепенно до 2 кГц на частоте 10 кГц. Поведение сигналов в критических полосах довольно сложное, но анализ имеющихся данных приводит к выводу, что сигнальные составляющие, попадающие в одну полосу, проще исследовать, чем набор таких составляющих в различных полосах.

Описанная система отличается от системы с поблочно плавающей запятой только тем, что сигналы в каждой из частотных полос обрабатываются независимо друг от друга. Недостатком обычной системы является то, что (при сжатии характеристики АЦП Для всего диапазона) отношение равное 60 дБ, не

(кликните для просмотра скана)

гарантирует отсутствия слышимых шумов. Сильный сигнал, сосредоточенный в одном конце диапазона, не повлияет на слышимость широкополосных шумов. Низкочастотный сигнал с большой амплитудой приведет к явному усилению шума квантования, так как подобный сигнал не создает эффективной маскировки. Эта проблема разрешается путем сжатия характеристики АЦП в отдельных узких долосах. Аналогичные решения были найдены при создании классических нецифровых систем шумоподавления [38, 88], хотя в таких системах применялись частотные каналы гораздо большей ширины, чем критические полосы.

Сигнал, поступающий из каждого полосового фильтра, дискре тизуется с частотой, вдвое превышающей ширину полосы фильтра, и полученные отсчеты подвергаются многоканальному уплотнению. Эквивалентная частота дискретизации при этом не изменяется, так как сумма всех частот по-прежнему равна удвоенной ширине полосы всей системы. Исходя из вышеизложенного, можно ожидать, что скорость создания информации здесь будет близка к а не к характерной для системы с поблочно цлавающей запятой.

Некоторое дополнительное сокращение скорости поступления информации можно получить, если учесть, что соседние частотные каналы могут сильно маскировать друг друга. Поэтому можно сделать адаптивным распределение числа разрядов между каналами. Тому из каналов, который заглушается мощным сигналом из соседних каналов или сильным сигналом в удаленном высокочастотном канале, можно отвести меньше разрядов. Подобный адаптивный метод довольно трудно описать математически и может оказаться, что его будет очень трудно реализовать, но тем не менее можно надеяться, что он позволит сократить скорость поступления информации на 20—30%.

Проведя этот предварительный анализ, можно сделать вывод, что оптимальный АЦП для одной монофонической программы, в котором используется психоакустическое согласование, по всей видимости, будет иметь скорость создания информации порядка Это примерно втрое лучше, чем при использовании -разрядного АЦП с постоянной характеристикой и частотой дискретизации или вдвое лучше, чем для системы сжатия с Плавающей запятой.

Пока не ясно, будет ли усложнение аппаратуры оправдано уменьшением объема информации. В некоторых случаях, когда стоимость передачи или хранения информации высока, сокращение объема информации, по-видимому, компенсирует дополнительные расходы. Так, например, для фонотеки, где хранится 10 000 рулонов пленки, тройное сокращение объема пленки может оказаться достаточной компенсацией усложнения аппаратуры. Аналогично стоимость линии связи может значительно перекрыть

стоимость аппаратуры сжатия, так как, например, 5000 км высококачественной линии связи стоят чрезвычайно дорого,

<< Предыдущий параграф Следующий параграф >>
Оглавление