Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro

SAMPAIO NETO, Nelson Cruz

Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro

Arquivo(s)

Tese_FerramentasRecursosLivres.pdf (1.33 MB)

Tipo

Tese

Data

2011-06-17

Autores

SAMPAIO NETO, Nelson Cruz

Editora(s)

Universidade Federal do Pará

Tipo de acesso

Acesso Aberto

Citação

SAMPAIO NETO, Nelson Cruz. Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro. Orientador: Aldebaro Barreto da Rocha Klautau Júnior. 2011. 96 f. Tese (Doutorado em Engenharia Elétrica.) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2011. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/2845. Acesso em:.

Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.

Agência de Fomento

FAPESPA - Fundação Amazônia de Amparo a Estudos e Pesquisas

Palavras-chave

Reconhecimento automático da voz Síntese da voz Automatic speech recognition Text-to-speech

Citação

SAMPAIO NETO, Nelson Cruz. Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro. Orientador: Aldebaro Barreto da Rocha Klautau Júnior. 2011. 96 f. Tese (Doutorado em Engenharia Elétrica.) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2011. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/2845. Acesso em:.

URI

https://repositorio.ufpa.br/handle/2011/2845

Coleções

Teses em Engenharia Elétrica (Doutorado) - PPGEE/ITEC

Página do item completo

Este item está licenciado sob uma Licença Creative Commons

Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro

Arquivo(s)

Tipo

Data

Autores

Título da Revista

ISSN da Revista

Título de Volume

item.page.theme

Editora(s)

Tipo de acesso

Contido em

Citação

DOI

Agência de Fomento

browse.metadata.ispartofseries

Palavras-chave

item.page.isbn

Fonte

item.page.dc.location.country

Citação

URI

Coleções

Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro

Arquivo(s)

Tipo

Data

Compartilhar

Autores

Título da Revista

ISSN da Revista

Título de Volume

item.page.theme

Editora(s)

Tipo de acesso

Contido em

Citação

DOI

Agência de Fomento

browse.metadata.ispartofseries

Palavras-chave

item.page.isbn

Fonte

item.page.dc.location.country

Citação

URI

Coleções