Machine learning of European Portuguese grapheme-to-phone conversion using a richer feature set

  • António Teixeira
  • Catarina Oliveira Centro de Línguas e Culturas, Universidade de Aveiro
  • Lurdes Castro Moutinho Centro de Línguas e Culturas, Universidade de Aveiro
Palavras-chave: Conversão Grafema-Fone, Português, Aprendizagem Automática, MBL, TBL, Sílaba

Resumo

Neste trabalho, são testados dois métodos de aprendizagem automática (MBL e TBL), bem como combinações destes métodos (em paralelo e em cascata), aplicados à tarefa de conversão grafema-fone do Português Europeu. É ainda investigado o interesse em utilizar informação silábica neste tipo de abordagem automática. Os melhores resultados são alcançados com o MBL e uma combinação dos dois métodos em paralelo. Em todos os sistemas testados, a inclusão de informação relativa à sílaba contribui para uma melhoria do desempenho, sendo a diferença estatisticamente significativa. Os sistemas com desempenhos mais elevados apresentam uma taxa de erro e uma Distância de Levenshtein similar à recentemente obtida para o Alemão, usando os mesmos modelos de treino.

Publicado
2006-01-01
Secção
Artigos