Проектирование устройства захвата и аналого-цифрового преобразования речевого сигнала

Человеческая речь - исторически сложившаяся форма общения посредством языковых конструкций, создаваемых на основе определённых правил. Она позволяет человеку познавать окружающий мир, передавать свои знания и опыт другим людям, аккумулировать их для передачи последующим поколениям. Процесс речи предполагает формирование и формулирование мыслей речевыми средствами образуемые, как правило, артикуляционным аппаратом человека. В целом звуки речи подразделяются на шумы и тоны. Тоны в речи возникают в результате колебания голосовых связок; шумы образуются в результате непериодических колебаний выходящей из лёгких струи воздуха. Математическую модель можно представить в виде возбуждающих генераторов тонового и белового шума и группы фильтров, модуляторов и ключей - рот, нос, язык, губы, обеспечивающих фильтрацию и формирование определённого ощущения звука.

У человека преобразование акустических волн в сигналы нейронных цепей происходит во внутреннем ухе, а более конкретно - в улитке. Улитка содержит в себе мембрану, различные участки которой резонируют на различных частотах, возбуждая нервные окончания. Параметры мембраны определяют спектр поспринимаемых звуков, у здорового взрослого человека он составляет 20 Гц-20 кГц. На других частотах резонанс в мембране не возникает, и они человеком не воспринимаются. Мозг человека анализирует разницу амплитуд, как звука, достигшего внешнего уха, так и разницу амплитуд в слуховом канале после ушной раковины для определения местоположения источника звука.

Звук представляет собой аналоговый сигнал, непрерывный во времени и принимающий произвольные неограниченные величины, его так же можно условно поделить на несколько частично пересекающихся классов:

1. тоновые (pitched):

o гармонические (harmonic),

o слабо гармонические (rough-garmonic);

o негармонические (inharmonic);

2. шумовые (noisy);

3. перкуссивные (percussive).

Первая передача речи на расстоянии, по проводам, была осуществлена в 1876 году североамериканским учёным, изобретателем и бизнесменом Александром Грэмом. Активное развитие техники, в частности развитие радиоприемников, позволило осуществить передачу речи без проводов. Первая публичная демонстрация состоялась 7 мая 1895 года Александром Степановичем Поповым. Уже в 1908 году был создан регламент в котором было зафиксировано распределение радиочастот между разными службами. В 1922 году было открыто свойство коротких волн преломляться в верхних слоях атмосферы, что позволило распространять сигналы на огромные расстояния. А в 1927 году была установлена радиотелефонная связь через Атлантический океан, которая могла передавать человеческую речь из Европы в Америку. С постепенным развитием цифровой техники важным параметрам стало качество речевого сигнала. Главным фактором, определяющим качество передачи речевого сигнала в низкоскоростных цифровых системах связи, является пропускная способность цифрового канала. Для того, чтобы иметь возможность передавать, хранить и обрабатывать звук посредством цифровой техники необходимо преобразование его цифровой вид - квантование. При квантовании с аналогового сигнала производятся выборки через определенные промежутки времени, а затем сопоставление каждой выборке конечной дискретного значения - цифрового кода. Такое представление имеет название импульсно-кодовая модуляция (ИКМ). Возможны и иные методы преобразования, но они как правило ускоспециальны, например, детекторы частоты с одной стороны и генераторы с цифровым управлением с другой.

Цифровое представление звука ценно прежде всего возможностью бесконечного хранения и тиражирования без потери качества, однако преобразование из аналоговой формы в цифровую и обратно все же неизбежно приводит к частичной его потере. Наиболее неприятные на слух искажения, вносимые на этапе оцифровки - гранулярный шум, возникающий при квантовании сигнала по уровню из-за округления амплитуды до ближайшего дискретного значения. В отличие от простого широкополосного шума, вносимого ошибками квантования, гранулярный шум представляет собой гармонические искажения сигнала, наиболее заметные в верхней части спектра.

При восстановлении звука из цифровой формы в аналоговую возникает проблема сглаживания ступенчатой формы сигнала и подавления гармоник, вносимых частотой дискретизации. Из-за неидеальности АЧХ фильтров может происходить либо недостаточное подавление этих помех, либо избыточное ослабление полезных высокочастотных составляющих. Плохо подавленные гармоники частоты дискретизации искажают форму аналогового сигнала, что создает впечатление "шероховатого", "грязного" звука.

Цифровой звук обрабатывается посредством математических операций, применяемых к отдельным отсчетам сигнала, либо к группам отсчетов различной длины. Выполняемые математические операции могут либо имитировать работу традиционных аналоговых средств обработки (микширование двух сигналов - сложение, усиление/ослабление сигнала - умножение на константу, модуляция - умножение на функцию и т.п.), либо использовать альтернативные методы - например, разложение сигнала в спектр (ряд Фурье), коррекция отдельных частотных составляющих, затем обратная "сборка" сигнала из спектра.

Обработка цифровых сигналов подразделяется на линейную (в реальном времени, над "живым" сигналом) и нелинейную - над предварительно записанным сигналом. Линейная обработка требует достаточного быстродействия вычислительной системы (процессора); в ряде случаев невозможно совмещение требуемого быстродействия и качества, и тогда используется упрощенная обработка с пониженным качеством. Нелинейная обработка никак не ограничена во времени, поэтому для нее могут быть использованы вычислительные средства любой мощности, а время обработки, особенно с высоким качеством, может достигать нескольких минут и даже часов.

Для обработки применяются как универсальные процессоры общего назначения - Intel 8035, 8051, 80x86, Motorola 68xxx, SPARC - так и специализированные цифровые сигнальные процессоры (Digital Signal Processor, DSP) Texas Instruments TMS xxx, Motorola 56xxx, Analog Devices ADSP-xxxx и др.

Разница между универсальным процессором и DSP состоит в том, что первый ориентирован на широкий класс задач - научных, экономических, логических, игровых и т.п., и содержит большой набор команд общего назначения, в котором преобладают обычные математические и логические операции. DSP специально ориентированы на обработку сигналов и содержат наборы специфических операций - сложение с ограничением, перемножение векторов, вычисление математического ряда и т.п. Реализация даже несложной обработки звука на универсальном процессоре требует значительного быстродействия и далеко не всегда возможна в реальном времени, в то время как даже простые DSP нередко справляются в реальном времени с относительно сложной обработкой, а мощные DSP способны выполнять качественную спектральную обработку сразу нескольких сигналов.

В силу своей специализации DSP редко применяются самостоятельно - чаще всего устройство обработки имеет универсальный процессор средней мощности для управления всем устройством, приема/передачи информации, взаимодействия с пользователем, и один или несколько DSP - собственно для обработки звукового сигнала. Например, для реализации надежной и быстрой обработки сигналов в компьютерных системах применяют специализированные платы с DSP, через которые пропускается обрабатываемый сигнал, в то время как центральному процессору компьютера остаются лишь функции управления и передачи.

Поскольку любой цифровой сигнал представляется реальной электрической кривой напряжения или тока - его форма так или иначе искажается при любой передаче, а "замороженный" для хранения сигнал (сигналограмма) подвержен деградации в силу обычных физических причин. Все эти воздействия на форму несущего сигнала являются помехами, которые до определенной величины не изменяют информационного содержания сигнала, как отдельные искажения и выпадения букв в словах обычно не мешают правильному пониманию этих слов, причем избыточность информации, как и увеличение длины слов, повышает вероятность успешного распознавания.

Сам несущий сигнал может искажаться, однако переносимая им информация - закодированный звуковой сигнал - в абсолютном большинстве случаев остается неизменной.

Для того, чтобы качество несущего сигнала не ухудшалось, любая передача полезной звуковой информации - копирование, запись на носитель и считывание с него - обязательно должна включать операцию восстановления формы несущего сигнала, а в идеале - и первичного цифрового вида сигнала информационного, и лишь после этого заново сформированный несущий сигнал может быть передан следующему потребителю. В случае прямого копирования без восстановления (например, обычным переписыванием видеокассеты с цифровым сигналом, полученным при помощи ИКМ-приставки, на обычных видеомагнитофонах) качество цифрового сигнала ухудшается, хотя он по-прежнему полностью содержит всю переносимую им информацию. Однако после многократного последовательного копирования или длительного хранения качество ухудшается настолько, что начинают возникать неисправимые ошибки, необратимо искажающие переносимую сигналом информацию. Поэтому копирование и передачу цифровых сигналов необходимо вести только в цифровых устройствах, а при хранении на носителях - своевременно "освежать" не дожидаясь необратимой деградации (для магнитных носителей этот срок оценивается в несколько лет). Правильно переданная или обновленная цифровая сигналограмма качества не теряет и может копироваться и существовать вечно в абсолютно неизменном виде.

Тем не менее, не следует забывать, что корректирующая способность любого кода конечна, а реальные носители далеки от идеальных, поэтому возникновение неисправимых ошибок - на такая уж редкая вещь, особенно при неаккуратном обращении с носителем. При чтении с новых и правильно хранимых DAT-кассет или компакт-дисков в качественных и надежных аппаратах таких ошибок практически не возникает, однако при старении, загрязнении и повреждении носителей и считывающих систем их становится больше. Одиночная неисправленная ошибка почти всегда незаметна на слух благодаря интерполяции, однако она приводит к искажению формы исходного звукового сигнала, а накопление таких ошибок со временем начинает ощущаться и на слух.

Отдельную проблему составляет сложность регистрации неисправленных ошибок, а также проверки идентичности оригинала и копии. Чаще всего конструкторы цифровых звуковых устройств, работающих в реальном времени, не озабочены вопросом точной проверки достоверности передачи, считая вполне достаточными меры, принятые для коррекции ошибок. Невозможность в общем случае повторной передачи ошибочного отсчета или блока приводит к тому, что интерполяция происходит скрытно и после копирования нельзя с уверенностью сказать, точно ли скопирован исходный сигнал. Индикаторы ошибки, имеющиеся в ряде устройств, обычно включаются только в момент ее возникновения, и в случае одиночных ошибок их срабатывание легко может остаться незамеченным. Даже в системах на основе персональных компьютеров чаще всего нет возможности контролировать правильность приема по цифровому интерфейсу или прямого считывания CD; выходом является только многократное повторение операции и сравнение результатов.

И наконец, в принципе возможны ситуации, когда даже незначительные ошибки способны необратимо исказить передаваемую информацию, оставшись при этом незамеченными системой передачи. Другое дело, что вероятность возникновения подобных ошибок исчезающе мала (порядка одной на несколько лет непрерывной передачи сигнала), поэтому такую возможность практически нигде не принимают в расчет.

Уточнение технических и эксплуатационных показателей.

Устройство предназначено для использования в стационарной аппаратуре (группа 1.1 по ГОСТ РВ 20.39.304-98). Предельные значения параметров окружающей среды, воздействующих на конструкцию для данной группы аппаратуры, приведены в таблице 1.1.

Таблица 1.1 Предельные значения параметров окружающей среды

Вибрация Частота, Гц Ускорение, м/с2

10-70 19,6

Ударные сотрясения Ускорение, м/с2 Длительность, мс

98 5-15

Одиночные удары Ускорение, м/с2 Длительность, мс

196 1-5

Температура максимальная Рабочая, °К Предельная, °К

323 333

Температура минимальная Рабочая, °К Предельная, °К

263 253

Влажность относительная Насыщенность, % Температура, °К

93 298±10

Акустические шумы Уровень, дБ Частота, Гц

85-125 50-1000

Давление атмосферное Максимальное, Па Минимальное, Па

110000 55000

Линейные ускорения Замедление, g Центральное, g

2-4 2-5

Ветровая нагрузка Рабочая, м/с Предельная, м/с

до 50 до 70

    Прочтите также:

    Расчет источников сообщений, сигналов и каналов
    сигнал кодирование информационный дискретный Эффективная организация обмена информации приобретает все большее значение как условие успешной практической деятельности людей. Объем информа ...

    Система ограничения доступа к компьютеру с использованием электронных ключей
    контроллер электронный ключ доступ В данном курсовом проекте поставлена задача разработать специализированный контроллер, обеспечивающий контролируемый доступ к персона ...

    Сети передачи дискретных сообщений
    Техника передачи дискретных сообщений играет все большую роль в жизни человеческого общества. Без нее немыслимо создание современных автоматизированных систем управления для различных от ...

    Основные разделы

    2018 © Все права защищены! >> www.techeducator.ru