13 de abril de 2014

Cabo-Verdiano conclui Doutoramento com distinção e louvor em Coimbra

Arlindo Oliveira da Veiga concluiu a sua tese de Doutoramento em Engenharia Eletrotécnica e de Computadores na Universidade de Coimbra com distinção e louvor, por unanimidade do júri. Veiga explica que a sua tese centra-se no processamento da fala, com o objetivo de aumentar a quantidade de recursos linguísticos disponíveis para o português.

Com o título “Treino não supervisionado de Modelos Acústicos para Reconhecimento de Fala”, Veiga foi orientado pelo Doutor Fernando Manuel dos Santos Perdigão e pelo Professor Doutor Luís António Vieira de Sá. Este jovem, que é natural de Pilão-Cão em São Miguel, foi posto à prova no passado dia 01 de Abril, e foi aprovado com distinção e louvor.

Arlindo de Oliveira Veiga diz que a sua tese é multidisciplinar e envolve o processamento automático da fala e uma forte componente de estudos linguísticos (fonética/fonologia). O agora doutorado entende que o desenvolvimento e a aplicação das tecnologias de fala para uma língua estão relacionados com a quantidade e a qualidade de recursos disponíveis. “Poucas línguas apresentam todos os recursos necessários para desenvolver as tecnologias de fala. A língua portuguesa, como muitas outras, tem escassez de recursos públicos e livres, o que pode dificultar a aplicação de tecnologias de fala que incorporam esta língua”, pontua.

Os trabalhos descritos na tese apresentam uma abordagem para criar bases de dados de fala, recorrendo aos recursos do domínio público e livres, partindo de sinais multimédia sem transcrições ortográficas ou fonéticas. É apresentada uma solução para aproveitar a disponibilidade de material multimédia existente no domínio público e selecionar segmentos de fala adequados para treinar modelos acústicos. Para isso, foram desenvolvidos sistemas para segmentar e classificar os noticiários.

Estes sistemas, diz, podem ser combinados para criar bases de dados de fala com transcrição fonética sem a intervenção humana. “Com o auxílio deste sistema, foi criado um dicionário com cerca de 40 mil entradas que foram verificadas manualmente. A deteção de uma palavra utiliza medidas de similaridades entre as verosimilhanças do modelo da palavra e do modelo de enchimento, um detetor de picos e um limiar definido por forma a minimizar os erros de deteção”, explica. Acrescenta ainda que foram publicados recursos para a língua portuguesa que resultaram na aplicação dos vários sistemas desenvolvidos ao longa da execução da sua tese.

Veiga afirma que criou um demonstrador online para ilustrar um sistema de conversão de grafemas para fonemas para o português e que pode ser testado no endereço http://www.co.it.pt/ labfala/g2p/.


Fonte: Asemana

2 comentários: