Comparação de desempenho Ferret vs Lucene
|
|
O pessoal do Montezuma fez um benchmark do seu sistema de procura de texto contra o Lucene e o Ferret. A parte boa: Montezuma é quase tão rápido qto o Lucene. A ruim? O Ferret está ignorância em velocidade, provavelmente pq uma boa parte dele está em C. O Mauricio Fernandes do Eigenclass pegou sua pequena implementação de full text search engine e repetiu o benchmark comparando com o Ferret. Conclusões? Parece que o simples funcionou muito bem. E o Ferret continua ignorante… Você pode achar o plugin act_as_ferret aqui. (Parêntesis do Ronie: Eu sempre achei uma idéia legal poder misturar linguagens de script com C, velocidade qdo precisa, versatilidade qdo precisa) |
|
|
eu estou usando o ferret, (junto com o plugin acts as ferret) nao tenho como comparar velocidade, mas… sinceramente, eu nao vi nada que um comando sql nao faria, talvez o plugin nao disponibilize todas as funcionalidades do ferret (eu nem olhei a documentacao do ferret, só do plugin mesmo) nao sei como faço para ele encontrar palavras digitadas parcialmente ou de forma incorreta |
|
|
O blog Eigen postou uma correção em seu benchmark Ele também andou melhorando seu mecanismo de search, inclusive colocando uma parte do código em C. Aparentemente ele conseguiu bons resultados, mas como ele mesmo aponta, algo ainda pode estar errado. De qualquer maneira, se ele continuar com esse brincadeira, logo teremos mais um Full Text Search Engine digno de uso. |
|
|
para encontrar a morfologia (plural, palavras incorretas) e etc … vc usa fuzzy search algo como: engeneiro~0.7 -> engenheiro |

