BISCAINHO, LUIZ WAGNER PEREIRA Restauraοc~ao Digital de Sinais de Áudio Provenientes de Gravaοc~oes Musicais Degradadas [Rio de Janeiro] XI, p., 9,7 c

Σχετικά έγγραφα
CASE: Projeto EDW Enterprise Data Warehouse

Eletromagnetismo. Johny Carvalho Silva Universidade Federal do Rio Grande Instituto de Matemática, Física e Estatística. ...:: Solução ::...

Tema 3. Espazos métricos. Topoloxía Xeral,

Tema: Enerxía 01/02/06 DEPARTAMENTO DE FÍSICA E QUÍMICA

EXERCICIOS DE REFORZO: RECTAS E PLANOS

Onde posso encontrar o formulário para? Onde posso encontrar o formulário para? Για να ρωτήσετε που μπορείτε να βρείτε μια φόρμα

Pessoal Cumprimentos. Cumprimentos - Casamento. Cumprimentos - Noivado

Inscrição Carta de Referência

Procedementos operatorios de unións non soldadas

Αιτήσεις Συνοδευτική Επιστολή

EXERCICIOS AUTOAVALIABLES: RECTAS E PLANOS. 3. Cal é o vector de posición da orixe de coordenadas O? Cales son as coordenadas do punto O?

PAU XUÑO 2011 MATEMÁTICAS II

EPGE / FGV MFEE - ECONOMETRIA. Gabarito - Monitoria 01-10/04/2007

Ονομαστική Γενική Αιτιατική Κλητική Αρσ. γλ υκοί γλ υκών γλ υκούς γλ υκοί Θηλ. γλ υκές γλ υκών γλ υκές γλ υκές Ουδ. γλ υκά γλ υκών γλ υκά γλ υκά

Ταξίδι Τρώγοντας έξω. Τρώγοντας έξω - Στην είσοδο. Τρώγοντας έξω - Παραγγελία φαγητού

Ακαδημαϊκός Λόγος Κύριο Μέρος

Ταξίδι Τρώγοντας έξω. Τρώγοντας έξω - Στην είσοδο. Τρώγοντας έξω - Παραγγελία φαγητού

Τ ο οριστ ικό άρθρο ΕΝΙΚΟΣ Ονομαστική Γενική Αιτιατική Κλ ητική Αρσενικός ο του το(ν) Θηλ υκός η της τη(ν) Ουδέτερο το του το ΠΛΗΘΥ ΝΤΙΚΟΣ

PAU XUÑO 2010 MATEMÁTICAS II

ln x, d) y = (3x 5 5x 2 + 7) 8 x

COMO TESTAR COMPONENTES ELETRÔNICOS

Física P.A.U. VIBRACIÓNS E ONDAS 1 VIBRACIÓNS E ONDAS

REPÚBLICA DE ANGOLA EMBAIXADA DA REPÚBLICA DE ANGOLA NA GRÉCIA DIPLOMÁTICO OFICIAL ORDINÁRIO ΙΠΛΩΜΑΤΙΚΗ ΕΠΙΣΗΜΗ ΚΑΝΟΝΙΚΗ

KIT DE DRENAJE DE CONDENSADOS

Tema 1. Espazos topolóxicos. Topoloxía Xeral, 2016

VERBOS II: A idéia de tempo, em grego, refere-se à qualidade da ação e não propriamente ao tempo,


Business Opening. Very formal, recipient has a special title that must be used in place of their name

Αξιότιμε κύριε Πρόεδρε, Muito formal, o destinatário tem um título especial que deve ser usado no lugar do seu primeiro nome

EXERCICIOS DE ÁLXEBRA. PAU GALICIA

Ταξίδι Γενικά. Γενικά - Τα απαραίτητα. Γενικά - Συνομιλία. Παράκληση για βοήθεια. Ερώτηση σε πρόσωπο αν μιλά αγγλικά

Métodos Matemáticos en Física L4F. CONDICIONES de CONTORNO+Fuerzas Externas (Cap. 3, libro APL)

At IP Barão de Geraldo

SHEILA CRISLEY DE ASSIS

FILTRO DE RED METÁLICA

IX. ESPAZO EUCLÍDEO TRIDIMENSIONAL: Aplicacións ao cálculo de distancias, áreas e volumes

a a

Ταξίδι Γενικά. Γενικά - Τα απαραίτητα. Γενικά - Συνομιλία. Παράκληση για βοήθεια. Ερώτηση σε πρόσωπο αν μιλά αγγλικά

Panel lateral/de esquina de la Synergy. Synergy πλαϊνή σταθερή πλευρά τετράγωνης καμπίνας. Rohová/boční zástěna Synergy

Puerta corredera de la Synergy Synergy Συρόμενη πόρτα Posuvné dveře Synergy Porta de correr da Synergy

A circunferencia e o círculo

Lógica Proposicional. Justificación de la validez del razonamiento?

Lógica Proposicional

PAU XUÑO 2012 MATEMÁTICAS II

Ξεκινήστε εδώ Καλώς ορίσατε στον οδηγό γρήγορης έναρξης

bab.la Φράσεις: Προσωπική Αλληλογραφία Ευχές ελληνικά-πορτογαλικά

Ventiladores helicoidales murales o tubulares, versión PL equipados con hélice de plástico y versión AL equipados con hélice de aluminio.

Problemas resueltos del teorema de Bolzano

Catálogodegrandespotencias

Προσωπική Αλληλογραφία Ευχές

Batista Pioneira Bíblia,

Συνέλευση Κανονικών Ορθοδόξων Επισκόπων Λατινικής Αμερικής. Γενική Γραμματεία ΔΕΛΤΙΟ ΤΥΠΟΥ

TRIGONOMETRIA. hipotenusa L 2. hipotenusa

1. O ESPAZO VECTORIAL DOS VECTORES LIBRES 1.1. DEFINICIÓN DE VECTOR LIBRE

Prova escrita de conhecimentos específicos de MATEMÁTICA

Ξεκινήστε εδώ Οδηγός γρήγορης έναρξης

DECLARATION OF PERFORMANCE No CPD-0522 REV 1.02

Comece aqui. Ξεκινήστε εδώ Guia de início rápido. Blu-ray Disc /DVD Home Theatre System. Οδηγός γρήγορης έναρξης BDV-N9200WL BDV-N7200WL BDV-N7200WL

Física P.A.U. VIBRACIÓNS E ONDAS 1 VIBRACIÓNS E ONDAS

Inecuacións. Obxectivos

EXERCICIOS DE REFORZO: SISTEMAS DE ECUACIÓNS LINEAIS

ss rt çã r s t à rs r ç s rt s 1 ê s Pr r Pós r çã ís r t çã tít st r t


MATEMÁTICAS. (Responder soamente a unha das opcións de cada bloque temático). BLOQUE 1 (ÁLXEBRA LINEAL) (Puntuación máxima 3 puntos)

1.ª DECLINAÇÃO. Somente nomes femininos e masculinos, não há neutros. Os nomes femininos têm o

MANUAL DE INSTRUÇÕES MANUAL DE INSTRUCCIONES

Εμπορική αλληλογραφία Επιστολή

XEOMETRÍA NO ESPAZO. - Se dun vector se coñecen a orixe, o módulo, a dirección e o sentido, este está perfectamente determinado no espazo.

Física P.A.U. ELECTROMAGNETISMO 1 ELECTROMAGNETISMO. F = m a

VIII. ESPAZO EUCLÍDEO TRIDIMENSIONAL: Ángulos, perpendicularidade de rectas e planos

A proba constará de vinte cuestións tipo test. As cuestións tipo test teñen tres posibles respostas, das que soamente unha é correcta.

Instruções de funcionamento Οδηγίες χρήσης. Integrated Stereo Amplifier TA-A1ES

LIVRO II POLITICA. 1261α] ἀλλὰ πότερον ὅσων ἐνδέχεται κοινωνῆσαι, πάντων βέλτιον κοινωνεῖν τὴν µέλλουσαν οἰκήσεσθαι πόλιν καλῶς, LIVRO II

MARCELO RENATO DE CERQUEIRA PAES JÚNIOR ALOCAÇÃO OTIMIZADA DE CENTRAIS SOLARES FOTOVOLTAICAS NO SISTEMA DE DISTRIBUIÇÃO DO OESTE DO ESTADO DA PARAÍBA

SILVA JÚNIOR, JOSÉ DE ALENCAR Controle Robusto H Aplicado em Motores de Indução [Rio de Janeiro] 23 xxv, 152 p. 29,7 cm (COPPE/UFRJ, M.Sc., Engenharia

AMORTIGUADORES DE VIBRACIÓN

MANUAL DE INSTRUÇÕES MANUAL DE INSTRUCCIONES

ESTRUTURA ATÓMICA E CLASIFICACIÓN PERIÓDICA DOS ELEMENTOS

NÚMEROS COMPLEXOS. Páxina 147 REFLEXIONA E RESOLVE. Extraer fóra da raíz. Potencias de. Como se manexa k 1? Saca fóra da raíz:

Tradução: Sexto Empírico, Contra os gramáticos Rodrigo Pinto de Brito (UFS) 1 Rafael Hughenin (IFRJ)

FM Stereo FM/AM Receiver

Exame tipo. C. Problemas (Valoración: 5 puntos, 2,5 puntos cada problema)

MATEMÁTICAS. (Responder soamente a unha das opcións de cada bloque temático). BLOQUE 1 (ÁLXEBRA LINEAL) (Puntuación máxima 3 puntos)

PÁGINA 106 PÁGINA a) sen 30 = 1/2 b) cos 120 = 1/2. c) tg 135 = 1 d) cos 45 = PÁGINA 109

ELECTROTECNIA. BLOQUE 1: ANÁLISE DE CIRCUÍTOS (Elixir A ou B) A.- No circuíto da figura determinar o valor da intensidade na resistencia R 2

Ano 2018 FÍSICA. SOL:a...máx. 1,00 Un son grave ten baixa frecuencia, polo que a súa lonxitude de onda é maior.

Física e química 4º ESO. As forzas 01/12/09 Nome:

DVD Home Theatre System

LUGARES XEOMÉTRICOS. CÓNICAS

Química A Extensivo V. 5

1 La teoría de Jeans. t + (n v) = 0 (1) b) Navier-Stokes (conservación del impulso) c) Poisson

VII. RECTAS E PLANOS NO ESPAZO

Métodos Estadísticos en la Ingeniería

Áreas de corpos xeométricos

"ECOLOGIA, HISTÓRIA EVOLUTIVA E CONSERVAÇÃO DE THALASSEUS SANDVICENSIS/ ACUFLAVIDUS/ EURYGNATHUS (AVES: STERNIDAE).

Una visión alberiana del tema. Abstract *** El marco teórico. democracia, república y emprendedores; alberdiano

PAU XUÑO 2011 MATEMÁTICAS II

Laurindo Joao Dos Santos Lauro ~ Τιµοκατάλογος

Escenas de episodios anteriores

CARELINK EXPRESS TM MONITOR ΣΥΣΚΕΥΗ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ. MONITOR CARELINK EXPRESS TM Model 2020B/2020C / Μοντέλο 2020B/2020C / Modelo 2020B/2020C

Transcript:

RESTAURACο ~AO DIGITAL DE SINAIS DE ÁUDIO PROVENIENTES DE GRAVACο ~OES MUSICAIS DEGRADADAS Luiz Wagner Pereira Biscainho TESE SUBMETIDA AO CORPO DOCENTE DA COORDENACο ~AO DOS PROGRAMAS DE PÓS-GRADUACο ~AO DE ENGENHARIA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENCο ~AO DO GRAU DE DOUTOR EM CI^ENCIAS EM ENGENHARIA ELÉTRICA. Aprovada por: Prof. PauloSérgioRamirez Diniz, Ph.D. Prof. Eduardo Ant^onio Barros da Silva, Ph.D. Prof. Jacques Szczupak, Ph.D. Prof. MárcioNogueira de Souza, D.Sc. Prof. Weiler Alves Finamore, Ph.D. RIO DE JANEIRO, RJ - BRASIL DEZEMBRO DE

BISCAINHO, LUIZ WAGNER PEREIRA Restauraοc~ao Digital de Sinais de Áudio Provenientes de Gravaοc~oes Musicais Degradadas [Rio de Janeiro] XI, p., 9,7 cm (COPPE/UFRJ, D.Sc., Engenharia Elétrica, ) Tese - Universidade Federal do Rio de Janeiro, COPPE. Restauraοc~ao de Áudio. Processamento Digital de Sinais I. COPPE/UFRJ II. T tulo (série) ii

Resumoda Tese apresentada a COPPE/UFRJ como parte dos requisitos necessários para a obtenοc~ao do grau de Doutor em Ci^encias (D.Sc.) RESTAURACο ~AO DIGITAL DE SINAIS DE ÁUDIO PROVENIENTES DE GRAVACο ~OES MUSICAIS DEGRADADAS Luiz Wagner Pereira Biscainho Dezembro/ Orientador: PauloSérgioRamirez Diniz Programa de Engenharia Elétrica Este trabalho apresenta um conjunto de técnicas de processamento digital de sinais de áudio orientadas para a restauraοc~ao de gravaοc~oes musicais deterioradas. Mesclandoaspectos teóricos e práticos, discute-se e afere-se odesempenhodas técnicas correntes es~ao propostas contribuiοc~oes no sentidode melhor interpretá-las e analisá-las, reduzir seu esforοco computacional ou melhorar seu desempenho. S~ao abordados tratamentos de ru do de fundo, ru do impulsivo e pulsos longos, envolvendo principalmente modelagem estat stica de sinais, representaοc~ao de sinais na freqü^encia, sistemas adaptativos, sistemas multitaxa e wavelets. Como coprodutos, traοcam-se discuss~oes sobre modelos, cujas aplicaοc~oes transcendem a restauraοc~ao de áudio. Há um esforοco em aplicar, quando poss vel, métodos objetivos adequados a avaliaοc~aode resultados práticos. iii

Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the requirements for the degree of Doctor of Science (D.Sc.) DIGITAL RESTORATION OF AUDIO SIGNALS FROM DEGRADED MUSICAL RECORDINGS Luiz Wagner Pereira Biscainho December/ Advisor: PauloSérgioRamirez Diniz Department: Electrical Engineering This work investigates a myriad of digital signal processsing techniques applied to restoration of degraded musical recordings. Mixing theoretical and practical aspects, current techniques have their performance discussed and analyzed, leading tonew contributions aiming new interpretations and analysis methods, reduced computational effort or better performance. Elimination of background noise, impulsive noise and long duration pulses are achieved by employing several techniques, mainly through statistical signal modelling, signal frequency description, adaptive systems, multirate systems and wavelets. As by-products, results related to ARMA models in sub-bands are advanced, of which potential applications transcend audio restoration. An effort is made in employing, whenever possible, appropriate objective methods to evaluate the quality oftherestored audiosignals. iv

Dedicoeste trabalho a Música e aos músicos, que, artistas que s~ao, fazem de sua loucura uma mensagem a Humanidade. v

Agradeοco a todas as pessoas que possibilitaram a elaboraοc~ao deste trabalho: minha fam lia, minha analista Ana Maria Rozzante de Castro e meus amigos extra-trabalho, pelo suporte pessoal; meus alunos-amigos que se aventuraram comigo nesta pesquisa, Paulo Ant^onio Andrade Esquef, Arthur Haerdy Jr., Fábio Pacheco Freeland, Mauro Flores de Carvalhoe CristianoNogueira dos Santos, sem os quais n~ao teria realizado a tese; meus outros alunos, que fazem parte do lado mais gratificante da minha profiss~ao; meu amigo duas vezes orientador PauloSérgio Ramirez Diniz, pela inspiraοc~ao e confianοca; meu amigo Eduardo Ant^onio Barros da Silva, pelo est mulo e exemplo; demais colegas-professores do Departamento de Eletr^onica, pelo apoio irrestrito que me proporcionaram; funcionários e demais alunos que também me honraram com sua colaboraοc~ao. Gostaria ainda de destacar que minha participaοc~ao no LPS tem sido inesgotável fonte de energia para minha evoluοc~aoprofissional e pessoal. vi

Sumário Folha de Rosto Ficha Catalográfica Resumo Abstract Dedicatória Agradecimentos Sumário i ii iii iv v vi vii Apresentaοc~ao. Uma Breve História do ÁudioGravado.................. O Problema-Objetivo........................... 4.3 Elementos da Descriοc~ao de Sinais Musicais de Áudio.......... 6.3. Dom niocont nuo........................ 6.3.. Modelo Estat stico................... 6.3.. Conteúdo Espectral.................. 7.3..3 Faixa Din^amica..................... 8.3..4 Percepοc~ao........................ 8.3. Dom niodiscreto......................... 9.3.. Modelo Estat stico................... 9.3.. Taxa de Amostragem.................. 9.3..3 Númerode Bits de Representaοc~ao........... 9.3..4 Percepοc~ao........................ 9 vii

.3..5 Padr~ao Adotado neste Trabalho............ I Sistemas e Modelos Efeito de Zeros, Pólos e Pares Zero-Pólo sobre uma Funοc~ao de Transfer^encia Discreta 3. Efeitode Zeroou Pólo Individual.................... 4. Efeitode Par Zero-Pólo...........................3 Exemplo.................................. 8 3 Efeito da Quantizaοc~ao sobre a Obtenοc~ao do Modelo AR para um Sinal de Áudio 9 3. Apresentaοc~ao do Problema........................ 3 3.. Ind cio: Interpolaοc~aode Amostras Faltantes Baseada em Modelo 3 3.. Origem: CálculodoModeloAR................. 3 3..3 Testes Adicionais......................... 3 3. Premissas Teóricas............................ 3 3.. Descriοc~aodoErro de Quantizaοc~ao................ 3 3.. Estimaοc~aoLS de Par^ametros de Modelo AR.......... 33 3..3 Desviona Estimativa depar^ametros devido aru doaditivo. 34 3..4 Desviodos Pólos do Filtro Gerador devido ao Desvio nos Par^ametros domodeloar...................... 36 3.3 Explicaοc~oes e Soluοc~ao........................... 39 4 Modelo para um Processo AR Analisado em Oitavas por Banco de Filtros 4 4. Motivaοc~ao: Restauraοc~aode Áudio em Sub-Bandas........... 4 4. CasoGeral: Modelo para um Processo ARMA Dividido em Sub-Bandas 4 4.3 Modelo para um Processo AR Divididoem Oitavas.......... 45 4.4 Correlaοc~aoentre Sub-Bandas....................... 55 4.5 Uma Representaοc~ao Hierárquica..................... 55 4.6 Discuss~ao da Validade do Modelo.................... 59 4.7 Mapeamento de Zeros e Pólos em cada Sub-Banda........... 6 viii

4.7. Bancode Filtros Ideais...................... 6 4.7. Bancode Filtros Realizáveis................... 68 4.7.3 Exemplos Práticos e Constataοc~oes................ 7 5 Aliasing e Reconstruοc~ao Perfeita no Processamento Multitaxa 9 II Restauraοc~ao 96 6 Psicoacústica e Avaliaοc~ao Objetiva de Qualidade 98 6. Avaliaοc~aoda Qualidade de Sinais de Áudio............... 99 6. Psicoacústica............................... 6.. Audibilidade............................ 6.. Mascaramento........................... 6..3 Bandas Cr ticas.......................... 3 6..4 Espalhamento........................... 3 6..5 Compress~ao............................ 3 6.3 PAQM................................... 7 6.4 Proposta: PAQM Adaptada a Aferiοc~ao da Qualidade de Sinais Restaurados.................................. 9 7 Interpolaοc~ao de Amostras Faltantes Baseada em Modelo 7. Formulaοc~aodoProblema......................... 7. Técnica de Base Determin stica: LS................... 3 7.3 Estimativa deml............................. 4 7.4 Estimaοc~aopor EM............................ 4 7.5 A Necessidade do Vetor-Par^ametro................... 5 7.6 Estimativa peloamostrador de Gibbs.................. 5 7.7 Da Implementaοc~ao............................ 6 7.8 Investigaοc~ao Realizada.......................... 6 7.8. Testes e Resultados........................ 6 7.8. Interpolaοc~aode Sinal Quantizado................ 7 8 Tratamento de Ru do Impulsivo 8. Caracterizaοc~ao............................... ix

8. Restauraοc~ao sem Modelo: Filtragem por Mediana........... 8.3 Restauraοc~ao com Modelagem do Sinal.................. 3 8.3. Notaοc~aoAdotada......................... 3 8.3. Detecοc~aopor Filtragem Inversa domodeloar + Interpolaοc~ao 4 8.3.3 Restauraοc~aoBayesiana...................... 8 8.4 Aperfeiοcoamentoda Detecοc~ao por Invers~ao do Modelo AR...... 9 8.4. Determinaοc~aoda Extens~ao da Falha.............. 3 8.4. Reiteraοc~aoe Parada doalgoritmopor Bloco.......... 3 8.4.3 Desempenho do Algoritmo Modificado............. 34 8.4.3. N~ao-Detecοc~ao efalsoalarme............. 35 8.4.3. Avaliaοc~aoSubjetiva.................. 35 8.4.4 Avaliaοc~aoObjetiva porcritérios Perceptivos.......... 36 8.5 Tratamentoem Sub-bandas....................... 37 8.5. Descriοc~aoe Discuss~ao....................... 37 8.5. Implementaοc~aoe Avaliaοc~ao................... 4 9 Tratamento de Pulsos Longos 4 9. Restauraοc~ao por Similaridade...................... 44 9.. Testes Realizados......................... 46 9. Supress~ao por Separaοc~ao de Processos AR............... 48 9.3 Detecοc~ao Rápida............................. 5 Restauraοc~ao de Sinais Contaminados por Ru do de Fundo 55. Métodos Baseados noespectro..................... 56.. Fundamentos........................... 56.. Subtraοc~aoEspectral....................... 56..3 Filtragem de Wiener....................... 57..4 Investigaοc~ao Realizada...................... 59..4. Avaliaοc~aoInicial de Desempenho........... 59..4. Proposiοc~oes....................... 6..4.3 Avaliaοc~aodas Proposiοc~oes............... 63. Método Baseado em Wavelet: Wavelet Shrinkage........... 65.. Princ pios da DWT........................ 65 x

.. Compress~ao de Informaοc~aoUsandoWavelets.......... 69..3 A Reduοc~ao de Ru dode Fundo................. 7..4 Métodos de Cálculodos Limiares................ 7..4. Método Minimax e Variante Prática......... 7..4. Método SURE (Stein's Unbiased Risk Estimate)... 7..4.3 Método H brido..................... 73..5 Investigaοc~ao: Avaliaοc~aoda Wavelet Shrinkage......... 74..5. Sinais e Estratégia................... 74..5. Medidas......................... 75..5.3 Conclus~oes....................... 79.3 ComentárioFinal............................. 8 Supressor Adaptativo de Ru do 8. Filtragem Adaptativa........................... 8. Supressor Adaptativo de Ru do..................... 84.3 Investigaοc~ao Realizada.......................... 85.3. Testes Práticos sobre Sinais Reais................ 85.3. Expectativas de Desempenho.................. 85 Avanοcos nos Métodos em Sub-bandas 89. Tratamento de Ru do Impulsivo Baseado em Modelo Realizado em Sub-bandas Revisitado.......................... 89. Tratamentode Ru dode Fundopor Filtragem de Wiener Baseada na DFT numa Estrutura em Oitavas.................... 93.. Filtragem de Wiener Baseada na DFT............. 93.. Filtragem de Wiener diretamente nas Sub-bandas....... 94..3 Composiοc~aoProposta....................... 95..3. Descriοc~ao........................ 95..3. Avaliaοc~ao........................ 96 Refer^encias Bibliográficas xi

Cap tulo Apresentaοc~ao Aidéia para otema desta tese resultou, inicialmente, de um antigointeresse pessoal em música quanto as obras, as interpretaοc~oes e, como extens~ao natural, a sua gravaοc~ao. A formaοc~ao em Engenharia Eletr^onica e sua subseqüente especializaοc~ao em Processamento de Sinais forneceram o arsenal técnico que permitirácon- tribuir um pouco para a preservaοc~ao da integridade de realizaοc~oes art sticas únicas notempo. Cronologicamente, o desenrolar do trabalho partiu de uma ampla pesquisa dos métodos mais modernos e em aplicaοc~aona restauraοc~aodigital de gravaοc~oes musicais degradadas, na forma em que estavam documentados na literatura cient fica. O passoseguinte, que envolveu maciοcas doses de bom-senso e criatividade, foi implementar os métodos de maior interesse e testá-los em condiοc~oes reais. Detectados seus principais problemas e limitaοc~oes, buscaram-se meios de explicá-los, reduzi-los e/ou solucioná-los. Alguns dos meios teóricos empregados acabaram por merecer qualificaοc~ao como tópicos independentes, por sua generalidade. A avaliaοc~ao quantitativa dos resultados práticos também mereceu especial cuidado. A organizaοc~ao final do texto assumiu uma ordem bem diferente daquela em que o trabalho foi realizado. Preferiu-se apresentar na Parte I os desenvolvimentos e resultados mais genéricos referentes aos modelos associados ao processamento, deixandopara a Parte II oque diz respeito a restauraοc~aopropriamente dita. Embora isson~aopareοca óbviopreliminarmente, todos os Cap tulos se interligam. Por outro lado, excetuando-se o Cap tulo final, houve um esforοco em torná-los autocontidos, aomenos quantoaoseu assuntoprincipal, ocasionandoum m nimode redund^ancia.

As publicaοc~oes do autor associadas a este trabalho s~ao [] (Cap tulo ); [] (Cap tulo 3); [3] e [4] (Cap tulo 4); [5] e [6] (Cap tulo 8); [7] (Cap tulo 9); e [8] (Cap tulo). O autor tentou fazer com que o texto seguisse estritamente o vocabulário recomendado em [9]. A ediοc~aofoi feita em LaTeX [, ].. Uma Breve História do Áudio Gravado Como forma de ambientar historicamente oalvodeste trabalho, é apresentada a seguir uma cronologia [, 3] bastante simplificada do som gravado. 877 Edison faz a primeira gravaοc~aonum fonógrafo para cilindros de lat~ao. 885 Bell & Tainter patenteiam o grafofone para cilindros de cera, com sulcos cortados verticalmente. 888 Berliner patenteia o gramofone para discos de vulcanite de 7" de di^ametro, com sulcos cortados lateralmente e só lado gravado a 7 rpm, para produοc~ao em massa. 897 Os discos passam a ser feitos de goma-laca, ainda reproduzidos a partir de agulhas de aοcode press~ao equivalente a 7 g. 898 Poulser patenteia o telegrafone, gravador magnéticopara fiode aοco. 9 A Victor Co. lanοca discos de "a78rpm. 94 A Odeon produz em massa discos gravados em ambos os lados. 96 É lanοcada a vitrola, com corneta embutida. 9 Edison obtém qualidade acústica superior com o uso de agulhas de diamante. 93 Edison fabrica discos. 95 S~ao produzidos os primeiros discos gravados eletricamente, pelosistema Western Electric, desenvolvido nos Bell Labs da AT&T. Vitaphone & Warner Brothers demonstram discos de alum nio coberto de acetato a 33 /3 rpm para uso em sincronismo com filmes.

96 Brush vende agulhas piezoelétricas superleves. 97 A AMI Co. faz as primeiras jukeboxes. 98 Pleufmer patenteia a aplicaοc~aode pó magnético a fita de papel. 99 Edison fabrica os últimos cilindros e discos. A RCA se funde a Victor. 93 Blumlein patenteia um método de gravaοc~aobinaural (estéreo). A RCA apresenta discos de Victrolac com sulco largoa 33 /3 rpm, que n~ao se popularizam. 93 A BASF e a AEG-Telefunken desenvolvem a gravaοc~ao em fita magnética a partir da patente de Pleufmer, vindoa lanοcar o magnetofone em 935. 934 É cunhada a express~ao alta-fidelidade (Hi-Fi). 939 Camras inventa independentemente o gravador de fio, que se torna muito popular até 955 entre amadores. 948 A Columbia apresenta o disco long-play (LP) de " com microssulco a 33 /3 rpm em vinilite. É lanοcada a fita coberta de óxido férrico3m Scotch. A Magnecord faz oprimeirogravador de fita de rolo estéreo. 949 ARCA Victor apresenta odiscoextended-play (EP) de 7" com microssulco a 45 rpm em vinilite, mais tarde em poliestireno. 95 AMPEX e RCA comeοcam a trabalhar num video-tape recorder (VTR), fabricandoa primeira unidade móvel em 959. 954 ARCA Victor vende as primeiras fitas de rolo estéreo pré-gravadas. 958 O padr~aopara discos em estéreoé estabelecido. 963 A Philips demonstra o primeiro audiocassete compacto com fita de /8" de largura a 7/8 ips. 3

969 O sistema Dolby NR (Noise Reduction) é introduzido em fitas pré-gravadas. A Sony apresenta oprimeirovideocassete. 97 A Philips apresenta oprimeiroreprodutor de laser-disc (LD). 975 A Sony apresenta o video-cassete recorder (VCR) Betamax doméstico com fita de horade duraοc~ao. 976 AJVC apresenta ovcr VHS domésticocom fita de horade duraοc~ao. 977 RCA anuncia fitas de v deo de 4 horas de duraοc~ao. 978 A Pioneer desenvolve old. 979 ASony apresenta o walkman. 98 S~ao comercializados compact-discs (CD's) de 5". 983 É lanοcadoobeta HiFi VCR comsomfmdealta qualidade. 987 É apresentada a digital audio tape (DAT). 997 O digital video disc, depois digital versatile disc (DVD), se torna dispon vel comercialmente como meio de armazenamentode áudioe v deo e de dados de computador.. O Problema-Objetivo Com a tecnologia digital [4, 5], oarmazenamentode áudio sofreu sua maior revoluοc~aodesde a invenοc~aodofonógrafo. Pela primeira vez, foi poss vel gerar cópias rigorosamente iguais, garantir a perenidade de uma matriz, utilizar recursos de processamentoantes impensáveis e ter ocontrole sobre o bin^omio quantidade x qualidade da informaοc~ao. Por raz~oes históricas e art sticas, imediatamente se quis estender as gravaοc~oes analógicas as conquistas da nova era, quanto a possibilidade de preservá-las e, num passo adiante, de restaurar ou mesmo aumentar sua qualidade. Curiosamente, a mais ousada destas metas aumentar a qualidade motivou a primeira utilizaοc~aode processamento digital em música, na primeira metade dos anos 4

7 [6, 3], quandose aplicou a modelagem f sica dos sistemas de gravaοc~aodoin cio doséculo para, por filtragem inversa, reconstituir o sinal original. Considerando que o objetivo principal deste trabalho é o tratamento de sinais de áudiopré-gravados com vistas a recuperaοc~aode qualidade, faz-se necessário definir, em termos gerais, oconjunto-universo onde ele se insere. O primeiro aspecto a delimitar é o tipo das matrizes de áudio de que se ocupará otrabalho: cilindros, discos e fitas magnéticas [7]. Sendo essas as origens dos sinais, podemos classificar grosseiramente as falhas encontráveis em dois grandes grupos: distribu das e localizadas. As falhas distribu das podem ser de diversos tipos: ru do na forma de um chiado de fundo, de espectro largo em freqü^encia, aproximadamente plano (ru do branco) ou n~ao (ru do colorido), associado, em geral, ao uso de fitas magnéticas como meio de armazenamento; ru do de fundo de baixa freqü^encia, associado, em geral, a vibraοc~ao de motor no equipamento de gravaοc~ao ou reproduοc~ao; flutuaοc~oes de velocidade periódicas, originadas por excentricidade de disco, e n~ao-periódicas, origináveis na ediοc~ao e mixagem de diversas tomadas de som; e distorοc~oes globais, originadas em n~ao-linearidades inerentes aos processos de gravaοc~aoe reproduοc~ao. As falhas localizadas também podem ser de diversos tipos: ru do na forma de estalidos breves que, se muito próximos, podem dar a impress~ao de continuidade, caracterizado por pequenos pulsos dispersos aleatoriamente ao longo do sinal, e estalos n~ao-periódicos, caracterizados por pulsos de duraοc~ao relativamente longa, associados, em geral, a res duos agregados ou falhas no material do disco ou cilindro; estalos periódicos, também caracterizados por pulsos de duraοc~aorelativamente longa, originados por arranh~aoou quebra do discoou cilindro; ru dos periódicos de duraοc~ao muito longa, por vezes assemelhando-se a uma raspagem, originados, em geral, por res duos agregados no material ou desgaste n~ao-homog^eneo do disco ou cilindro; distorοc~ao por saturaοc~ao, caracterizada por limitaοc~ao r gida na amplitude do sinal, associada, em geral, a desgaste do disco ou cilindro ou a ajuste inadequado doequipamento de gravaοc~ao. Vale destacar que nem todos os ru dos presentes numa gravaοc~ao s~ao objeto de processamento. Pode ser desejável, por exemplo, preservar os ru dos da platéia em uma execuοc~ao aovivo, em nome da fidelidade. 5

.3 Elementos da Descriοc~ao de Sinais Musicais de Áudio O objetivo dessa Seοc~ao é prover alguma familiaridade com os sinais que se pretenderá, em geral, processar e com alguns princ pios e consideraοc~oes que podem ser empregados em sua modelagem..3. Dom nio Cont nuo.3.. Modelo Estat stico Descrever matematicamente um sinal de áudio musical gravado t pico de forma completa é uma tarefa imposs vel, se se consideram as infinitas possibilidades envolvendo seu espectro em freqü^encia (relacionado diretamente as notas musicais e aos timbres dos instrumentos) e sua pot^encia (relacionada diretamente a din^amica requerida) termos, aliás, imprecisos para essa categoria de sinais com caracter sticas t~aofortemente variantes notempo. Uma forma razoavelmente cautelosa de modelar um tal sinal é considerálo uma funοc~ao-amostra de um processo aleatório n~ao-estacionário [8, 9]. Nesse ponto, pode ser útil uma pequena discuss~ao: A maneira mais direta de associar esse modelo ao problema de restauraοc~ao, dadas diversas cópias de uma matriz, é interpretar cada uma como uma funοc~aoamostra de um processo composto de um sinal determin stico(osinal, propriamente dito) e outro, aleatório (as imperfeiοc~oes a eliminar). Contudo, na maioria dos casos, trata-se de restaurar uma única cópia dispon vel (ou de poucas cópias dispon veis) da gravaοc~ao, o que reduz a utilidade dessa abordagem. Alternativamente, pode-se atribuir um caráter aleatório ao próprio sinal de áudio (o que é mais usual). Porém, sem consideraοc~oes adicionais, a interpretaοc~ao f sica" do processo fica bem mais dif cil: o que formaria o ensemble? Avanοcando mais um passo nas hipóteses, se existe um intervalode tempo máximopara o qual o processo ainda pode ser considerado aproximadamente estacionário(oqual, para áudio musical t pico, costuma ser tomado entre 5 e 5 ms, conforme sua variabilidade maior ou menor no tempo) e se sup~oe a ergodicidade nesse intervalo (permitindo obter valores esperados a partir de médias temporais), está reabilitada a 6

interpretaοc~ao: uma única cópia do sinal (funοc~ao-amostra) pode responder peloprocesso n~ao-estacionário se janelas finitas permitirem caracterizar aproximadamente subprocessos estacionários ergódicos. Isso dispensa, na verdade, a interpretaοc~ao do ensemble, pois restringe a análise aotempo. Feitas tais consideraοc~oes, tornam a fazer sentido prático (para cada janela) pot^encia e espectro em freqü^encia, permitindo que se prossiga com a caracterizaοc~ao dosinal..3.. Conteúdo Espectral Costuma-se adotar os limites da audiοc~aohumana como Hz e khz[]. Assim sendo, parece razoável, para efeitode gravaοc~aode áudiomusical, buscar fidelidade aomenos dentrodesses limites. Contudo, este é um tópico pol^emico, gerando até hoje discuss~oes quanto ao limite superior útil do espectro em freqü^encia da informaοc~ao a gravar. Defendem alguns que freqü^encias n~ao decodificadas convencionalmente a partir do aparelho auditivo podem ser sentidas" de outras formas pelo corpo. Paralelamente, estudos t^em registrado que o espectro de instrumentos musicais (especialmente os de percuss~ao) pode atingir os khz com conteúdo ainda considerável! Outro dado importante, ligado ao refinamento necessário a descriοc~ao dos sinais musicais em freqü^encia, se refere a organizaοc~aoda escala musical. Atualmente, a música ocidental tradicional utiliza a escala temperada, que, adotando uma notapadr~ao, individualiza semitons dentrode cada oitavaespaοcados geometricamente. Por exemplo, escolhendo-se como padr~ao o lá em 44 Hz, o próximo lá estará em 88 Hz (a uma oitava de dist^ancia). E a raz~ao entre as freqü^encias de quaisquer semitons cont guos, por exemplo, si bemol e lá, é sempre ß ;6, ou seja, um semitom de dist^ancia corresponde a uma diferenοca de 6% em freqü^encia. Em funοc~ao do caráter predominantemente tonal da música, a inspeοc~ao do espectroem freqü^encia de um sinal de áudiomusical indica, usualmente, a presenοca de picos ressonantes e vales suaves. Representando-se esse sinal como a sa da de um filtro excitado por ru do branco (entrada com espectro plano), o filtro apresentará preferencialmente pólos a zeros. Outra representaοc~aoposs vel para osinal, de inspiraοc~aopróxima, é como uma combinaοc~aode senóides individualmente moduladas em 7

amplitude e freqü^encia [, ]. Alternativamente, a expans~ao do sinal como combinaοc~ao linear de funοc~oes-base apropriadas, como wavelets [3, 4], pode fornecer uma descriοc~ao que equilibra boa definiοc~aonotempoe na freqü^encia..3..3 Faixa Din^amica A audiοc~ao humana responde a diferenοcas de press~ao sonora, entre o limiar da audiοc~aoe olimiar da dor, de aproximadamente db. Uma orquestra sinf^onica numa sala de concertos pode ultrapassar db de faixa din^amica. Tais valores prop~oem um limite ideal para o armazenamentodoáudio..3..4 Percepοc~ao Embora esse tópico vá ser abordado com algum detalhe no Cap tulo6., vale mencionar dois aspectos [], ligados as Subseοc~oes.3.. e.3..3. ffl A freqü^encia percebida auditivamente (pitch) n~aoé, em geral, a mesma emitida pela fonte sonora, podendo a diferenοca percentual entre elas variar com a própria freqü^encia emitida, com o conjunto de freqü^encias eventualmente emitidas em conjunto com ela, com a intensidade do som e até mesmo com o estado emocional do ouvinte! ffl O aparelhoauditivotem uma espécie de controle automáticode ganho, de tal forma que em ambientes silenciosos prepara-se para ouvir mais alto" (aumentando a capacidade de percepοc~ao de detalhes) e em ambientes mais ruidosos prepara-se para ouvir mais baixo" (protegendo o sistema auditivocontra continuada press~aoexcessiva). Esse mecanismotem uma inércia considerável; por isso, permanecemos um pouco surdos por um tempo após sair de um show em volume muitoelevado. Isso dá uma dimens~ao de quanto podem ser equ vocas as medidas quantitativas usuais na caracterizaοc~aodosom ouvido. 8

.3. Dom nio Discreto.3.. Modelo Estat stico Considerando o sinal de áudio discretizado, o modelo na forma de um filtro gerador excitado por ru do branco mencionado na Subseοc~ao.3.. recai na forma autorregressiva (AR), que utiliza um filtro IIR só-pólos; em geral, conforme o conteúdo espectral menos ou mais rico, uma ordem entre e 5 é suficiente para descrever o sinal. Outros modelos mais sofisticados podem ser adotados [6], como o autorregressivo com média móvel (ARMA), que acrescenta zeros ao filtro gerador [8, 5], e variaοc~oes do AR e do ARMA incorporando n~ao-linearidades..3.. Taxa de Amostragem Segundo o Critério de Nyquist [6], a menor taxa de amostragem de um sinal cont nuode espectrolimitadosuperiormente na freqü^encia f sup que permite sua perfeita recuperaοc~ao como sinal cont nuo é f sup. Tomando o limite superior da audiοc~ao como khz, o padr~ao mais popular ainda adotado para o áudio comercial de alta qualidade (o CD [4]) realiza a amostragem a 44, khz, após limitar convenientemente em freqü^encia osinal de áudiooriginal..3..3 Número de Bits de Representaοc~ao O fato de o ouvido comprimir os sinais em pot^encia na percepοc~ao sugere que a quantizaοc~aodoáudioseja realizada de forma n~ao-linear, dando maior detalhe as diferenοcas entre pequenas amplitudes e menor detalhe as diferenοcas entre grandes amplitudes; pelomesmomotivo, parece desejável representar digitalmente suas amostras em ponto flutuante. Contudo, o padr~ao do CD [4] realiza quantizaοc~ao linear e representaοc~aoem pontofixocom 6 bits, oque resulta numa faixa din^amica teórica de cerca de 96 db..3..4 Percepοc~ao Testes realizados com ouvintes especializados indicaram que a taxa de amostragem m nima e onúmerode bits m nimopara que fosse impercept vel a diferenοca entre uma gravaοc~ao analógica e uma gravaοc~ao digital eram 96 khz e 4 bits, res- 9

pectivamente. Deve-se notar que isso só determina o limite da pol^emica entre as gravaοc~oes digitais e analógicas, mas n~aoentre as gravaοc~oes digitais e o som original. De qualquer modo, a tecnologia já permite alcanοcar aqueles valores no padr~ao do DVD. Import^ancia crescente tem sido dada aos aspectos perceptivos na codificaοc~ao de áudio, permitindo atingir elevadas taxas de compress~ao com alta qualidade..3..5 Padr~ao Adotado neste Trabalho Nos testes práticos efetuados ao longo deste trabalho, a menos de menοc~ao contrária, os arquivo sdeáudioa processar eram monaurais, amostrados a 44, khz e representados em ponto fixo com 6 bits. O processamento foi feito na precis~ao da máquina e os arquivos de sa da foram levados de volta ao formato original.

Parte I Sistemas e Modelos

Nesta Parte, figuram os tópicos teóricos que se originaram das investigaοc~oes em restauraοc~ao de áudio da Parte II e tinham um grau de generalidade tal que justificou sua apresentaοc~ao a parte. A ordem adotada foi aproximadamente a de crescente especificidade. O estudo sistemático do efeito de zeros e pólos em funοc~oes de transfer^encia discretas (assunto do Cap tulo ) surgiu do interesse em julgar a possibilidaade de simplificar a ordem do modelo derivadopara oprocessoar divididoem sub-bandas de freqü^encia (assunto do Cap tulo 4). Este modelo resultou da idéia de realizar o tratamento de ru do impulsivo em sub-bandas, apresentada na Seοc~ao 8.5. O estudo dos efeitos da quantizaοc~ao do sinal na obtenοc~ao de seu modelo AR (assunto do Cap tulo 3) buscou explicar o insucesso da interpolaοc~ao de sinais de áudio sob certas condiοc~oes, constatado na Subseοc~ao7.8.. Por fim, a discuss~ao sobre a reconstruοc~ao perfeita veio a tona após o uso bem-sucedido de bancos de filtros sem essa propriedade no processamento de ru dode fundo, na Subseοc~ao..4..

Cap tulo Efeito de Zeros, Pólos e Pares Zero-Pólo sobre uma Funοc~ao de Transfer^encia Discreta Em inúmeras aplicaοc~oes práticas, associam-se modelos (justificados fisicamente ou apenas matematicamente) a sinais e sistemas reais, de forma a permitir realizar algum tipo de processamento. A complexidade dos modelos determina, em última análise, a velocidade com que se pode realizar o processamento, com conseqü^encias sobre o alcance de sua eficácia. Assim, a utilizaοc~aode um modelo pressup~oe quase sempre sua máxima simplificaοc~ao sem comprometer o refinamentoque dele se espera na aplicaοc~aoem vista. Tendo em mente o interesse em reduzir a ordem do modelo adotado para um sistema discreto no tempo (aplicando-se, assim, diretamente, aos resultados do Cap tulo4), este Cap tulotenta quantificar oefeitoque oabandonode um zero, um pólo ou um par zero-pólo da funοc~ao de transfer^encia correspondente causaria sobre a resposta em freqü^encia do modelo. Como par^ametros de avaliaοc~ao, escolheramse os máximos desvios de módulo e de fase que os candidatos a descarte imp~oem, individualmente, a funοc~ao de transfer^encia. A estratégia adotada será, partindode um sistema de fase m nima, sem perda de generalidade, isolar a parcela que se deseja eliminar de sua funοc~aode transfer^encia global H(z) e compará-la com a funοc~ao de transfer^encia unitária. Os máximos desvios em relaοc~aoa esta representar~ao oerrocometido com a simplificaοc~ao. 3

Os diversos casos a seguir ser~ao apresentados, grosso modo, dos mais particulares para os mais gerais, de forma a facilitar sua interpretaοc~ao, embora pudessem ser todos reunidos no último, mais abrangente. Em [7, 8], a busca de fórmulas para cálculo de jh(e j! )j máx e jh(e j! )j m n para escalamento de filtros com funοc~oes de transfer^encia H(z) acaba por chegar a express~oes equivalentes as de desvio de módulo deste últimocaso equaοc~oes (.46), (.47) e (.48), embora descritas em funοc~aodos coeficientes dofiltro. Na seqü^encia, contudo, além de se formular também o desvio de fase, os resultados ser~ao descritos em funοc~ao dos módulos e fases dos zeros e pólos do filtro. Outrotrabalhoem linha próxima foi recentemente publicado em [9].. Efeito de Zero ou Pólo Individual Inicialmente, seráavaliada a eliminaοc~ao de zeros ou pólos. Pergunta a responder: qual a contribuiοc~ao do termo abandonado" a funοc~ao de transfer^encia global? Ser~ao examinados os casos de um zero real, dois zeros complexos conjugados, um pólo real e dois pólos complexos conjugados. Partindo do módulo e da fase de sua resposta em freqü^encia isolada, ser~ao obtidos em relaοc~ao a! o módulo m nimo m e o módulo máximo M, levando ao desvio máximo em relaοc~ao ao módulo unitário (ideal) M =máx( m; M ); (.) e o desvio máximo em relaοc~ao a fase nula (ideal). Tais par^ametros dependem da localizaοc~ao dos zeros ou pólos, em funοc~ao da qual ser~ao descritos anal tica e graficamente. Com refer^encia ao zero real a, considere-se a transfer^encia parcial Sua resposta em freqü^encia pode ser descrita por e H zr (z) = z a ; jaj < : (.) z jh zr (e j! )j = a cos! + a (.3) H zr (e j! ) = arctg a sen! a cos! : (.4) 4

Abandonar" o zero a corresponderia a fazer chega-se a H zr (z) ß : (.5) Definindo-se m como o m nimo e M como o máximo valor de jh zr (e j! )j, m = jaj; em! = 8 < : ß; se a< ; se a> (.6) e M =+jaj; em! = 8 < : ; se a< ß; se a>: (.7) O desvio máximode módulo, obtido pela equaοc~ao (.), é M = jaj: (.8) Definindo-se como o máximovalor do desvio j H zr (e j! )j, chega-se a na freqü^encia! = arccos a. = arcsen jaj; (.9) Com isso, obtiveram-se as express~oes que descrevem o efeito do zero real a sobre a resposta em freqü^encia global. Com refer^encia ao par de zeros complexos conjugados Ae ±jff, considere-se a transfer^encia parcial H zc (z) = z A cos ffz + A Sua resposta em freqü^encia pode ser descrita por e z ; A<: (.) jh zc (e j! )j = 4A cos ff cos! +A [ cos ff +cos(!)] 4A 3 cos ff cos! + A 4 (.) H zc (e j! ) = arctg A cos ff sen! A sen (!) A cos ff cos! + A cos(!) : (.) Abandonar" os zeros Ae ±jff corresponderia a fazer H zc (z) ß : (.3) 5

chega-se a e m = Definindo-se m como o m nimoe M comoomáximovalor de jh zc (e j! )j, 8 >< >: p Aj cos ffj + A ; se j cos ffj > p ( A )jsenffj; se j cos ffj < M = p +Aj cos ffj + A ; em! = A +A ; em! = 8 < : A +A ; em! = arccos O desvio máximode módulo M se obtém pela equaοc~ao (.). sendo 8 < : ; se <ff< ß ß; se ß <ff<ß +A A cos ff ; ß (.4) ß; se <ff< (.5) ; se ß <ff<ß: Definindo-se como o máximovalor dodesvioj H zc (e j! )j, chega-se a = máx (j H zc(e j! )j); (.6)! = arccos ( + 3A )cosff ± p ( A +9A 4 )cos ff +8A ( A ) 4A (.7) com»!» ß. Com isso, obtiveram-se as express~oes que descrevem oefeitodos zeros Ae ±jff sobre a resposta em freqü^encia global. A Figura. ilustra, respectivamente, os desvios de módulo e fase resultantes do abandono" de zeros, como funοc~oes de A, para ff =; ß 8 ; ß 4 ; 3ß 8 ; ß ; 5ß 8 ; 3ß 4 ; 7ß 8 e ß. Alguns exemplos: ffl Admitindo-se um desvio M = ; no módulo, o módulo máximo de cada zero descartável vai de A = p ;9 ß ;4359, para ff = ß, até A = ;, para ff =;ß. ffl Admitindo-se um desvio = ß na fase, o módulo máximo de cada zero descartável vai de A = p sen ß ß ;5559, paraff = ß,até A =senß ß ;564, para ff =;ß. O quadrado foi empregado por se tratar de um par de zeros, a fim de preservar a compatibilidade com os par^ametros definidos para o zero real simples. O fator foi empregado por se tratar de um par de zeros, a fim de preservar a compatibilidade com o par^ametro definido para o zero real simples. 6

,5,9 α,8, π α M,7,6,5,4,3 π/8, 7π/8 π/4, 3π/4 3π/8, 5π/8 π/ θ,5, π π/8, 7π/8 π/4, 3π/4 3π/8, 5π/8, π/,,,,3,4,5,6,7,8,9 A,,,3,4,5,6,7,8,9 A Figura.: Efeito de zero sobre a transfer^encia. Com refer^encia ao pólo real b, considere-se a transfer^encia parcial H pr (z) = z ; jbj < : (.8) z b Sua resposta em freqü^encia pode ser descrita por e jh pr (e j! )j = Abandonar" o pólo b corresponderia a fazer chega-se a b cos! + b (.9) H pr (e j! b sen! ) = arctg b cos! : (.) H pr (z) ß : (.) Definindo-se m como o m nimo e M como o máximo valor de jh pr (e j! )j, m = +jbj ; em! = 8 < : ; se b< ß; se b> (.) e M = jbj ; em! = 8 < : ß; se b< ; se b>: O desvio máximode módulo, obtido pela equaοc~ao (.), é M = jbj jbj (.3) (.4) 7

Definindo-se como o máximovalor do desvio jh pr (e j! )j, chega-se a = arcsen jbj; (.5) na freqü^encia! = arccos b. Com isso, obtiveram-se as express~oes que descrevem o efeito do pólo real b sobre a resposta em freqü^encia global. Com refer^encia ao par de pólos complexos conjugados Be ±jfi, considere-se a transfer^encia parcial H pc (z) = z z ; B < : (.6) B cos fiz + B Sua resposta em freqü^encia pode ser descrita por e jh pc (e j! )j = 4B cos fi cos! +B [ cos fi +cos(!)] 4B 3 cos fi cos! + B 4 (.7) H pc (e j! ) = arctg [B cos fi sen! B sen (!)] B cos fi cos! + B cos(!) : (.8) Abandonar" os pólos Be ±jfi corresponderia a fazer H pc (z) ß : (.9) chega-se a Definindo-se m como o m nimoe M como o máximovalor 3 de jh pc (e j! )j, m = p +Bj cos fij + B ; em! = 8 < : ß; se <fi< ß ; se ß <fi<ß: (.3) e M = 8 >< >: B ; se j cos fij > p Bj cos fij+b +B ; em! = 8 < : B ; se j cos fij < p( B )jsenfij +B ; em! = arccos ; se <fi< ß ß; se ß <fi<ß +B B cos fi : (.3) O desvio máximode módulo M se obtém pela equaοc~ao (.). 3 O quadrado foi empregado por se tratar de um par de pólos, a fim de preservar a compatibilidade com os par^ametros definidos para o pólo real simples. 8

Definindo-se como o máximovalor 4 dodesvioj H pc (e j! )j, chega-se a = máx (j H pc(e j! )j); (.3) sendo! = arccos (+3B )cosfi ± p ( B +9B 4 )cos fi +8B ( B ) 4B (.33) com»!» ß. Com isso, obtiveram-se as express~oes que descrevem oefeitodos pólos Be ±jfi sobre a resposta em freqü^encia global. A Figura. ilustra, respectivamente, os desvios de módulo e fase resultantes do abandono" de pólos, como funοc~oes de B, para fi =; ß 8 ; ß 4 ; 3ß 8 ; ß ; 5ß 8 ; 3ß 4 ; 7ß e ß. 8,5,8 β,6 β,4, π,, π M π/8, 7π/8 θ π/8, 7π/8,8,6,4 π/4, 3π/4 3π/8, 5π/8,5 π/4, 3π/4 3π/8, 5π/8 π/, π/,,,3,4,5,6,7,8,9 B,,,3,4,5,6,7,8,9 B Figura.: Efeito de pólo sobre a transfer^encia. Alguns exemplos: ffl Admitindo-se um desvio M = ; no módulo, o módulo máximo de cada pólo descartável vai de B = p ß ;466, para fi = ß, até B = ß ;99, para fi =;ß. ffl Admitindo-se um desvio = ß na fase, o módulo máximo de cada pólo descartável vai de B = p sen ß ß ;5559!, para fi = ß, até B = sen ß ß ;564, para fi =;ß. 4 O fator foi empregado por se tratar de um par de pólos, a fim de preservar a compatibilidade com o par^ametro definido para o pólo real simples. 9

Nota-se que zeros e pólos de fases próximas de zero ou próximas de ß t^em efeitomais significativoque zeros epólos de fases próximas de ß. Assim, é poss vel formular um teste simplificado que adote um único módulo como limiar de abandono", qualquer que seja a fase do zero ou pólo; nesse caso, deve ser usadoode pior caso, correspondente a fase nula.. Efeito de Par Zero-Pólo Na seqü^encia, será avaliado o cancelamento entre zeros e pólos próximos. Pergunta a responder: qual a contribuiοc~aodoquociente abandonado" a funοc~aode transfer^encia global? Ser~ao examinados os casos de um zero real com um pólo real e dois zeros complexos conjugados com dois pólos complexos conjugados. Partindo do módulo e da fase da resposta em freqü^encia isolada da raz~ao entre zero e pólo, ser~ao obtidos em relaοc~ao a! o módulo m nimo m e o módulo máximo M, levando ao desvio máximo M em relaοc~ao ao módulo unitário (ideal), e o desvio máximo em relaοc~ao a fase nula (ideal). Tais par^ametros dependem da localizaοc~ao dos zeros e pólos, em funοc~ao da qual ser~ao descritos anal tica e graficamente. Com relaοc~aoaozeroreal a e ao pólo real b, considere-se a transfer^encia parcial Sua resposta em freqü^encia pode ser descrita por H zpr (z) = z a ; jaj; jbj < : (.34) z b e jh zpr (e j! )j = a cos! + a b cos! + b (.35) H zpr (e j! (a b) sen! ) = arctg (a + b)cos! + ab : (.36) Cancelar" o pólo b com o zero a corresponderia a fazer chega-se a H zpr (z) ß : (.37) Definindo-se m como o m nimo e M como o máximo valor de jh zpr (e j! )j, m = 8 < : +a ; se a<b; em! = ß +b (.38) a b ; se a>b; em! =

e M = 8 < : a ; se a<b; em! = b (.39) +a +b ; se a>b; em! = ß: O desvio máximode módulo, obtido pela equaοc~ao (.), é M = ja bj jbj (.4) Definindo-se comoomáximovalor do desvio j H zpr (e j! )j, chega-se a na freqü^encia! = arccos a+b +ab. = arcsen ja bj ab ; (.4) Com isso, obtiveram-se as express~oes que descrevem o efeito de raz~ao entre ozeroreal a e opólo real b sobre a respo sta em freqü^encia global. Com refer^encia ao par de zeros complexos conjugados Ae ±jff e aopar de pólos complexos conjugados Be ±jfi, considere-se a transfer^encia parcial H zpc (z) = z A cos ffz + A z ; A; B < : (.4) B cos fiz + B Sua resposta em freqü^encia pode ser descrita por e jh zpc (e j! )j = 4A cos ff cos! +A [ cos ff +cos(!)] 4A 3 cos ff cos! + A 4 4B cos fi cos! +B [ cos fi +cos(!)] 4B 3 cos fi cos! + B 4 H zpc (e j! ) = arctg (.43) sen! A cos ff sen! sen! B cos fi sen! arctg cos! A cos ff cos!+a cos! B cos fi cos!+b : (.44) Cancelar" os zeros Ae ±jff com os pólos Be ±jfi corresponderia a fazer H zpc (z) ß : (.45) chega-se a Definindo-se m como o m nimoe M como o máximovalor 5 de jh zpc (e j! )j, m = q m n(jh zpc ()j; jh zpc ( )j; jh zpc (e j! )j;:::;jhzpc (e j! I )j) (.46) 5 O quadrado foi empregado por se tratar de um par de zeros e um par de pólos, a fim de preservar a compatibilidade com os par^ametros definidos para o par zero-pólo real simples.

e M = q máx(jh zpc ()j; jh zpc ( )j; jh zpc (e j! )j; :::; jh zpc (e j! I )j); (.47) sendo! i ; i =; :::; I, asi poss veis soluοc~oes de 4AB[A( + B )cosfi B( + A )cosff]cos!+ +[4A B (cos ff cos fi) (A B )( A B )] cos!+ +A( + A )[( B ) +4B cos fi]cosff B( + B )[( A ) +4A cos ff]cosfi = (.48) com»!» ß. O desvio máximode módulo M se obtém pela equaοc~ao (.). Definindo-se como o máximovalor 6 dodesvioj H zpc (e j! )j, chega-se a = máx (j H zpc(e j! )j; :::; j H zpc (e j! J )j); (.49) sendo! j ; j =; :::; J, asj poss veis soluοc~oes de 4AB[A( B )cosfi B( A )cosff]cos 3! (A B )( + A B +4AB cos ff cos fi)cos!+ +[+3(A +B )+A B +4AB cos ff cos fi][a( B )cosff B( A )cosfi]cos! (A B )( A B )+[B ( A 4 )cos fi A ( B 4 )cos ff)] = com»!» ß. (.5) Com isso, obtiveram-se as express~oes que definem o efeito da raz~ao entre os zeros Ae ±jff e ospólos Be ±jfi sobre a resposta em freqü^encia global. Para ilustrar os desvios de módulo e fase resultantes do cancelamento aproximadode zeros por pólos, dois casos particulares ser~aoexaminados. As Figuras.3 e.4 mostram, respectivamente, os desvios de módulo e fase quando a fase dos zeros é igual a fase dos pólos como funοc~oes de A, e as Figuras.5 e.6 mostram, respectivamente, os desvios de módulo e fase quando o módulo dos zeros é igual aomódulo dos pólos como funοc~oes de ff, para B =; 6 ; 8 ; 4 ; e;9 efi =; ß 8 ; ß 4 ; 3ß 8 ; ß ; 5ß 8 ; 3ß 4 ; 7ß 8 e ß. Alguns exemplos: 6 O fator foi empregado por se tratar de um par de zeros e um par de pólos,afimdepreservar a compatibilidade com o par^ametro definido para o par zero-pólo real simples.

β=,π β=π/8,7π/8,9,9,8,8,7,7,6,6 M,5 M,5,4,4,3,3,,,, B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A β=π/4,3π/4 β=3π/8,5π/8,9,9,8,8,7,7,6,6 M,5 M,5,4,4,3,3,,,, B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A β=π/,9,8,7,6 M,5,4,3,, B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A Figura.3: Efeito de zero e pólo de fases iguais no módulo da funοc~ao de transfer^encia. 3

β=,π β=π/8,7π/8,5,,8 θ θ,6,5,4, B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A β=π/4,3π/4 β=3π/8,5π/8,9,8,8,7,6 θ,6 θ,5,4,4,3,,, B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A β=π/,7,6,5 θ,4,3,, B /6 /8 /4 /,9,,,3,4,5,6,7,8,9 A Figura.4: Efeito de zero e pólo de fases iguais na fase da funοc~ao de transfer^encia. 4

B=/6 B=/8,,5,,,8 M,6 M,5,4,,,5 β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α B=/4 B=/,6,8,5,6,4,4, M,3 M,8,,6, β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α,4, β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α B=,9,8,6,4, M,8,6,4, β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α Figura.5: Efeito de zero e pólo de módulos iguais no módulo da funοc~ao de transfer^encia. 5

B=/6 B=/8,,,,8,5 θ,6 θ,,4,,5 β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α B=/4 B=/,9 θ,45,4,35,3,5, θ,8,7,6,5,4,5,3,,,5 β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α, β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α B=,9,4,,8 θ,6,4, β π/8 π/4 3π/8 π/ 5π/8 3π/4 7π/8 π,5,5,5 3 α Figura.6: Efeito de zero e pólo de módulos iguais na fase da funοc~ao de transfer^encia. 6

ffl Admitindo-se um desvio M = ; no módulo, o módulo de um zero que cancele aproximadamente um pólo de módulo B = ;9, tendoambos fase nula, vai de A =;89 até A =;9. ffl Admitindo-se um desvio = ß na fase, o módulo de um zero que cancele aproximadamente um pólo de módulo B =;9, tendo ambos fase nula, vai de A = ;9 sen( ß ) ;9sen( ß ) ß ;8654 até A = ;9+sen( ß ) +;9sen( ß ) ß ;96. ffl Admitindo-se um desvio M =; nomódulo, a fase de um zero que cancele aproximadamente um pólo de fase fi = ß, tendo ambos módulo igual a ;9, vai de ff ß ß ;445 até ff ß ß +;445. ffl Admitindo-se um desvio = ß na fase, a fase de um zero que cancele aproximadamente um pólo de fase fi = ß, tendo ambos módulo igual a ;9, vai de ff ß ß ;3345 até ff ß ß +;3345. No caso de fases iguais, nota-se que: para uma dada diferenοca relativa entre seus módulos, a raz~ao entre zeros e pólos de fases próximas de ou próximas de ß tem efeito mais significativo que a raz~ao entre zeros e pólos de fases próximas de ß; e o efeitoda diferenοca percentual entre os módulos do zero e do pólo se acentua com o aumentodomódulo do pólo. Assim, é poss vel formular um teste simplificado que adote para o zero um único módulo como limiar de cancelamento de um pólo, qualquer que seja sua fase; ent~ao, deve ser usado o de pior caso, correspondente a fase nula. No caso de módulos iguais, nota-se que: o efeito da diferenοca entre as fases do zero e do pólo se acentua com o aumento do módulo do pólo; para uma dada diferenοca entre suas fases, o efeito da raz~ao entre zeros e pólos tende a independer da fase dopólo, a medida que seu módulo aumenta. Assim, é poss vel formular um teste simplificadoque adote para ozerouma diferenοca de fase única como limiar de cancelamentode um pólo, qualquer que seja sua fase; ent~ao, por simplicidade, pode ser usado, ainda que n~aosendoo pior caso, o correspondente a fase igual a ß. No caso mais geral (e realista) em que módulos e fases s~ao diferentes, é poss vel adotar como teste simplificado a combinaοc~ao dos dois testes simplificados anteriores. 7

.3 Exemplo Para ilustrar ousodos critérios sugeridos para reduοc~ao da ordem de modelos, seja um modelo cuja funοc~aode transfer^encia inclui um pólo complexo ;9e j;5ß eum zero complexo ;89e j;7ß. Deseja-se saber se este par pode ser desprezado, caso se aceitem desvios M < ; e < ;ß na resposta em freqü^encia global. O cálculo diretofornece M = ;948 e = ;889ß, o u seja, opar pode ser desprezado. Adotando-se o critériocombinadobaseadonos módulos e fases do par, proposto no final da Seοc~ao.: supondo ff = fi = ß, B =;9 resultaria em M =;46 4 e = ;88ß; supondo A = B = ;9, fi = ß 4 resultaria em M = ;77 e = ;98ß. Tendo satisfeitoos testes simultaneamente, o par seria consideradodesprez vel. Alternativamente, adotando-se o critério combinado simplificado: supondo fases iguais e adotando as restriοc~oes referentes a fi =, B = ;9 resultaria em uma faixa ja ;9j < ; para que se admitisse o cancelamento do par; supondo módulos iguais e adotando as restriοc~oes referentes a fi = ß, B = ;9 resultaria em uma faixa jff ;5ßj < ;5ß para que se admitisse ocancelamentodopar. Ambas as condiοc~oes tendo sido atendidas, o teste simplificado também autorizaria a reduοc~ao da ordem do modelo. 8

Cap tulo 3 Efeito da Quantizaοc~ao sobre a Obtenοc~ao do Modelo AR para um Sinal de Áudio Uma situaοc~ao recorrente no processamento digital de sinais de voz e áudio é a necessidade de se estimar um modelo estat stico para descrever esses sinais. Um modelo freqüentemente adotado é oprocessoautorregressivo (AR), obtido pela passagem de ru do branco por um filtro digital linear só-pólos. E, tipicamente, as vers~oes discretas desses sinais s~ao representadas digitalmente em ponto fixo. Da o interesse em estudar oefeitodoerrode quantizaοc~ao dos sinais sobre seu modelo AR. Este Cap tulo parte de um problema prático encontrado num contexto de restauraοc~ao de sinais de áudio, mais especificamente na interpolaοc~ao de amostras faltantes baseada em modelo (v. Seοc~ao 7.8.), o qual mostra-se ter origem na estimativa polarizada do modelo AR para sinais que sofreram quantizaοc~ao. Revisam-se aspectos relacionados com o desvio dos coeficientes domodeloar devido a quantizaοc~ao do sinal modelado, permitindo descrever o desvio nos coeficientes em funοc~ao donúmerode bits da representaοc~aodosinal e, potencialmente, corrigi-lo. Investigase, ainda, a sensibilidade da posiοc~aodos pólos do filtro gerador associado em relaοc~ao aos coeficientes, explicando a ocorr^encia preferencial do desvio de pólos em dadas regi~oes do espectro. 9

3. Apresentaοc~ao do Problema 3.. Ind cio: Interpolaοc~ao de Amostras Faltantes Baseada em Modelo Em determinado estágio deste trabalho, no qual se estudava a interpolaοc~ao de amostras faltantes num sinal baseada em modelo (Subseοc~ao 7.8.), verificou-se que a quantizaοc~aodosinal pode prejudicar a interpolaοc~ao. O exemplo que denunciou o problema consistia em interpolar 4 amostras num sinal formado pela soma de senóides de freqü^encias distintas. O resultado, reproduzido na Figura 3., indica que a senóide de freqü^encia inferior n~ao foi interpolada entre as amostras 375 e 775. 3 3 4 x 4 4 4 6 8 amostra k Figura 3.: Sinal quantizado interpolado. Testes preliminares revelaram que a anomalia era gradativamente eliminada com o aumento do número de bits com que se quantizava o sinal a interpolar (originando-se, portanto, nesta quantizaοc~ao) e ocorria preferencialmente com freqü^encias baixas. Por outro lado, n~ao era afetada pelo número de amostras a interpolar nem pelotamanhodobloco, sugerindoque poderia n~aoser propriamente a interpolaοc~aoa falhar, mas apenas ocálculodomodelo nela envolvido. 3

3.. Origem: Cálculo do Modelo AR O sinal doexemplocitadona Subseοc~ao3.. é um processo AR de 4a. ordem degenerado na soma de senóides, cujo filtro gerador teórico associado teria pólos e ±j ß e e ±j ß 5. Calcularam-se os pólos referentes a estimativa porm nimos Quadrados (LS) dos coeficientes domodeloar para o bloco completo do sinal quantizado em 6 bits, obtendo-se aproximadamente, ;93 e e ±j ß 53. Isso confirmou a observaοc~aode que só a senóide na freqü^encia superior era interpolada de fato, sóela era modelada, enquanto a outra dava origem a pólos reais. Com isso, o objetivopassou a ser explicar a relaοc~aoentre oerrona modelagem e a quantizaοc~ao do sinal a modelar, além do motivo da ocorr^encia preferencial do problema em baixas freqü^encias. 3..3 Testes Adicionais AR genéricos. Abandonou-se o caso especial da senóide e efetuaram-se testes sobre processos Processos de primeira ordem n~aotrouxeram informaοc~oes de interesse. Independendode quantizaοc~ao, processos de segunda ordem com pólos complexos forneceram indicaοc~oes de cunho geral: ffl O modelo falha para fase exageradamente baixa, abaixo de ß ; a t tulode ilustraοc~ao, no caso de áudioamostradoa 44, khz, uma senóide de freqü^encia ß corresponde a,5 Hz, ou seja, nolimite inferior da audiοc~aohumana. ffl A estimativa da localizaοc~ao dos pólos é t~ao menos precisa quanto mais o módulo m se afasta da unidade; isson~aoé necessariamente um problema, uma vez que pólos de módulo reduzido contribuem pouco na resposta em freqü^encia (v. Seοc~ao.). Passandoaocasode quarta ordem quantizado, em que se enquadra o exemplo já discutidodas senóides, fizeram-se outras constataοc~oes. ffl Embora houvesse a prefer^encia genérica pelas fases reduzidas, a anomalia ocorria em funοc~ao dos valores das duas fases tomados em conjunto; por exemplo, = ß = ß ß n~ao era modelada se combinada com < < ß, enquanto que n~aoera modelada se combinada com ß < < ß. 3