Fonética Soundex
Este algoritmo de busca é baseado no algoritmo: SOUNDEX desenvolvido originalmente por: ‘Robert C. Russel’ e ‘Margaret K. Oddel’.
Foi desenvolvido com base na língua inglesa.
Ele ignora o valor fonético de todas as vogais e distingue seis tipos diferentes de fonemas entre as consoantes.
É um algoritmo extremamente simples, e que, serviu de base para o desenvolvimento de dezenas de outros algoritmos fonéticos pelo mundo (em ferramentas de bancos de dados, aplicativos de análise de senso, etc.).
Foi patenteado em 1918 e 1922.
Fonética BuscaBR
Este algoritmo de busca é baseado no trabalho de ‘Fred Jorge Tavares de Lucena’ em seu trabalho ‘Busca Fonética em Português do Brasil’ pela ‘Unibratec’.
Neste trabalho Fred propõe uma reforma no algoritmo SOUNDEX, onde leva em conta valores fonéticos não previstos no SOUNDEX além de prever de erros de ortografia mais comuns.
Leva em conta em determinados casos o valor fonético das vogais, além de criar uma gama maior de valores fonéticos entre as consoantes (não apenas as seis previstas no SOUNDEX).
Fonética Clássica
Este algoritmo de busca foi desenvolvido por ‘Alexandro Landmann Fenner’ e é baseado únicamente no português brasileiro.
Prevê inúmeros valores fonéticos para vogais e consoantes além de diversas combinações entre elas. Trata-se de um algoritmo complexo e bastante completo.
Tenta tratar o maior número possível de valores fonéticos. Há também previsão de erros ortográficos (mas como há uma grande quantidade de representações suportada, vários erros ortográficos não são detectados).
É exclusividade nossa, não é baseado no SOUNDEX e estamos trabalhando para melhorá-lo a cada dia.
Expressão Regular
É um algoritmo de pesquisa muito simples, assim como os que a maioria dos sistemas de busca utilizam. Apenas ignora acentos, maiúsculas/minúsculas e a ordem das palavras.
Observações
1) Os 'valores fonéticos' supracitados são representações binárias de fonemas. A forma usada em computação para identificação fonética, não trata-se de valor fonético linguístico, apesar de ser uma forma de representá-lo.