JavaFree.org | RubyOnBr.org

Comparação de desempenho Ferret vs Lucene

Acompanhar Comparação de desempenho Ferret vs Lucene 4 posts, 3 participantes

Avatar Ronie Uliana 891 posts

O pessoal do Montezuma fez um benchmark do seu sistema de procura de texto contra o Lucene e o Ferret.

A parte boa: Montezuma é quase tão rápido qto o Lucene. A ruim? O Ferret está ignorância em velocidade, provavelmente pq uma boa parte dele está em C.

O Mauricio Fernandes do Eigenclass pegou sua pequena implementação de full text search engine e repetiu o benchmark
comparando com o Ferret.

Conclusões? Parece que o simples funcionou muito bem. E o Ferret continua ignorante… Você pode achar o plugin act_as_ferret aqui.

(Parêntesis do Ronie: Eu sempre achei uma idéia legal poder misturar linguagens de script com C, velocidade qdo precisa, versatilidade qdo precisa)

 
Avatar jmp 104 posts

eu estou usando o ferret, (junto com o plugin acts as ferret) nao tenho como comparar velocidade, mas… sinceramente, eu nao vi nada que um comando sql nao faria, talvez o plugin nao disponibilize todas as funcionalidades do ferret (eu nem olhei a documentacao do ferret, só do plugin mesmo)

nao sei como faço para ele encontrar palavras digitadas parcialmente ou de forma incorreta

 
Avatar Ronie Uliana 891 posts

O blog Eigen postou uma correção em seu benchmark

Ele também andou melhorando seu mecanismo de search, inclusive colocando uma parte do código em C. Aparentemente ele conseguiu bons resultados, mas como ele mesmo aponta, algo ainda pode estar errado.

De qualquer maneira, se ele continuar com esse brincadeira, logo teremos mais um Full Text Search Engine digno de uso.

 
Avatar antonio 196 posts

para encontrar a morfologia (plural, palavras incorretas) e etc … vc usa fuzzy search

algo como:

engeneiro~0.7 → engenheiro