Language models in automatic speech recognition

  • Ciro Martins
  • António Teixeira
  • João Neto L2F, Spoken Language Systems Lab; INESC-ID/IST

Resumo

O presente artigo descreve o trabalho desenvolvido com o objectivo de melhorar o desempenho da componente modelo de linguagem de um sistema de reconhecimento de fala contínua para a língua Portuguesa. Como modelo de base, utilizou-se um sistema de reconhecimento de fala de grandes vocabulários desenvolvido para uma tarefa de reconhecimento de noticias (Broadcast News). Foram analisadas duas metodologias diferentes com o objectivo de aumentar a eficácia do sistema: a utilização de maiores quantidades de dados para melhor estimação dos parâmetros associados ao modelo de linguagem, e a utilização de diferentes técnicas de "pruning" e "discounting" dos referidos parâmetros. Os resultados mostram que com a utilização de maiores quantidades de dados se obtiveram ligeiras melhorias a nível da taxa de eficácia de reconhecimento (cerca de 5%). Aplicando uma técnica de "pruning" baseada no conceito de entropia, obteve-se uma redução significativa da dimensão do modelo de linguagem (reduções de 30% ou mais), com um ligeiro incremento dos valores da perplexidade e taxa de erro ao nível da palavra.

Publicado
2005-01-01
Secção
Artigos