As tecnologias que permitem a transmissão de uma quantidade cada vez maior de dados através de mídias convencionais como a linha telefônica evoluem rapidamente. Com isso, novos serviços e novos recursos se tornam disponíveis, resultando em novos equipamentos que tornam nossa vida mais cômoda, mais segura e mais simples. Esse é o caso da voz de Alta definição sobre ou HD-VoIP, de que trataremos nesse artigo, baseado em ampla documentação da Texas instruments tendo sido escrito em 2007.

 

Com a finalidade de se conseguir a transmissão de voz com níveis mais elevados de qualidade e performance através de protocolos de internet (IP), a Texas Instruments (www.ti.com), anunciou em abril melhorias na sua tecnologia que redefinem soluções para suas aplicações de voz sobre IP (VoIP).

Com essas redefinições, as aplicações oferecidas se aproximam mais ainda da obtenção de voz de alta definição através de protocolos de Internet (VoIP).

Para essas aplicações, a Texas Instruments está licenciando um novo codec de super banda larga do tipo AAC de baixo retardo, a partir do Fraunhofer Institute for Integrated Circuits IIS, sediado em Erlanger, Alemanha.

O Instituto Fraunhofer é onde foi inventado o MP3 e além disso eles são co-inventores da codificação de áudio AAC.

Alimentado pelos DSPs de alta performance da Texas Instruments, o codec MPEG-4 AAC-LD de superbanda larga oferece benefícios substanciais quando comparados com as tecnologias anteriores de áudio. Além disso, sua performance tornará a voz de alta definição (HD), normal sobre as redes IP globais. Para quem deseja saber mais, a Texas Instruments apresenta informações detalhadas sobre o assunto no site www.ti.com/visionforvoice.

A nova tecnologia permite transmitir voz com uma taxa de amostragem que chega aos 48 kHz, o que significa uma melhoria considerável em relação ás tecnologias de banda estreita.

Isso significa uma qualidade de áudio próxima a dos CDs, com taxas de amostragem na faixa de 48 a 64 kbps, para aplicações melhores como voz e vídeo sobre IP, assim como a transmissão de música através do telefone.

Quanto maior for a taxa de amostragem de um sinal de áudio, maior será sua qualidade, com as faixas passantes se alargando e abrangendo tanto o extremo das altas como das baixas freqüências. Isso significa uma considerável diferença tanto na ressonância como da inteligibilidade da voz.

Da mesma forma que a TV de alta definição (HDTV) revolucionou o modo como se assiste televisão e o rádio de alta definição (HD radio) melhora a comunicação de milhões de pessoas, HD voice, como é chamada essa nova tecnologia, vai trazer novos canais para a comunicação de voz de alta qualidade.

Um outro ponto importante a ser considerado é que, com uma qualidade melhor de voz será possível implementar certos tipos de recursos que hoje são impossíveis, como o reconhecimento de voz, o controle remoto através da voz e até mesmo a tradução simultânea.

Evidentemente, para suportar essa nova tecnologia devem ocorrer de forma simultânea avanços nas tecnologias de redes, e no caso do uso doméstico será possível que as pessoas façam praticamente tudo pelo simples comando de voz. As luzes da sala, o televisor, o ventilador e até mesmo o atendimento a um toque da campainha podem ser feitos pelo simples pronunciar de uma palavra do usuário, conforme sugere a figura 1..

 

Figura 1 - colocando em funcionamento um forno de microondas pelo telefone
Figura 1 - colocando em funcionamento um forno de microondas pelo telefone "prepare o almoço, por favor!" .

 

Com essa tecnologia de super-bandalarga, as soluções VoIP da Texas Instruments possibilita o envio de som com qualidade de CD em comunicações por telefone atém de suportar uma gama completa de recursos de voz e música, incluindo áudio comparável ao MP3.

Na figura 2 mostramos um exemplo de recurso que vai se tornar possível com essa tecnologia que é a tradução on-line da palavra falada.

 

Figura 2 - Tradução on-line
Figura 2 - Tradução on-line

 

 

Como funciona

Nos sistemas de definição padrão ou standard definition(ST) para transmissão de voz, a amostragem é feita por codecs lentos, operando com 8 k amostragens por segundo (8 kbps), convertendo-a num código de 8 bits que corresponde a 64 kbps, o que resulta numa qualidade de som que pode ser comparada ao rádio AM.

Por outro lado, no sistema da faixa larga ou alta definição- high definition ou HD a amostragem é feita numa taxa de 32 kbps de largura, o que é possível graças a uma avançada técnica de compressão, conforme mostra a figura 3.

Com isso é possível obter som de excelente fidelidade a ponto de se poder aplicar técnicas avançadas de processamento como as necessárias ao reconhecimento de voz.

 


 

O uso dessas técnicas se deve aos avanços que os padrões IEEE 802.11 de comunicação via rede vem passando. Dos 800 kbps para 50 Mbps via cabo, chegando a 100 Mbps nos sistemas ópticos e até mais.

Com isso não só vídeo via rede como também áudio de alta qualidade pode ser transmitido.

Veja que está ocorrendo com o áudio e vídeo via redes algo semelhante ao que ocorreu com o som e imagem na TV convencional. A TV em cores veio antes do som estéreo em TV e a TV de alta definição passou a ser tratada quase que simultaneamente com a transmissão de som em diversos canais.