Nossos dados mostram que quando as pessoas procuram um determinado produto, a maioria delas usa cerca de 1,5 palavras. Essas consultas curtas, infelizmente, dificultam que pesquisas de texto completo ofereçam resultados relevantes. Embora haja uma melhoria no uso de filtros, muitas vezes há muitos resultados que podem ser confusos.
Uma das maneiras de tornar a pesquisa mais eficaz é usar a abordagem de “aprender a classificar”, que cria uma classificação ideal de resultados. No entanto, mesmo esse método de machine learning não é todo poderoso – e é por isso que criamos a compreensão de consultas, um ótimo companheiro para “aprender a classificar”.
A pesquisa de texto completo é excelente se você usar consultas mais longas, digamos quatro ou mais palavras, ou termos especiais, como um código de produto. Nestes casos, a consulta geralmente fornece exatamente o que você procura na primeira posição ou mostra uma página “sem resultados”. De qualquer forma, ambas as situações são melhores do que oferecer uma lista de resultados completamente irrelevantes, o que geralmente acontece se você usar consultas mais curtas e ainda minimizar ou deixar de fora palavras exclusivas.
Como a pesquisa funciona no mundo real
Na verdade, é assim que a maioria das pessoas pesquisa. Nossos dados mostram que, em média, as pessoas usam 1,43 palavras por consulta (com um desvio padrão de +/- 0,58, calculado com nossos mais de 150 clientes mais ativos). Embora tenhamos clientes com muitas consultas somente de código de produto (isso depende do domínio), a mediana de consultas somente de código de produto é de apenas 2,9%.
Pessoas que usam consultas curtas e não específicas são a base dos problemas de tecnologia de pesquisa de texto completo. As desvantagens da pesquisa de texto completo são as mesmas que suas principais vantagens: ela pode encontrar qualquer coisa que corresponda à consulta, literalmente em qualquer lugar. E assim geralmente encontra toneladas de resultados e deixa o pesquisador classificá-los. A pontuação do texto completo, calculada a partir de consultas curtas e não específicas, não é boa o suficiente para produzir a classificação dos resultados mais relevantes.
Como as empresas de e-commerce devem responder a isso?
É por isso que existe o “aprender a classificar”. Este método baseado em machine learning, que ordena os resultados por um valor numérico que representa sua relevância, combina o comportamento humano com métricas de texto completo e cria uma classificação ideal de resultados. Na Luigi’s Box, já incorporamos esse mecanismo em nossos produtos relacionados à pesquisa. Vimos, no entanto, que apesar de ser muito útil, “aprender a classificar” não é a solução mágica para a solução de pesquisa definitiva. É um desafio aprender o modelo de classificação correto para uma consulta que é vista uma vez por mês, e há muitos domínios onde existe uma longa cauda dessas consultas e deve ser atendida.
A solução seria incentivar os usuários a confiar mais em filtros para restringir os resultados da pesquisa com base nos parâmetros específicos de seu interesse. No entanto, ao considerar filtros, pode haver opções ruins. Por exemplo, um de nossos clientes tem mais de 2.000 parâmetros diferentes (dependendo da categoria do produto) e quase 19.000 valores diferentes para esses parâmetros. É impossível construir uma interface intuitiva e simples para todos eles.
Compreensão de consultas disponível agora
Nossa abordagem para esse problema é reconhecer a intenção de pesquisa dos usuários e transformar o número máximo de termos de consulta em filtros úteis. Por exemplo, se um usuário digita “fones de ouvido abertos”, reconhecemos automaticamente o filtro “sistema acústico: aberto”, que geralmente não está disponível por meio de uma interface facetada padrão, e informamos ao usuário que ele pode desativar o filtro caso mude de ideia. Podemos lidar com qualquer um dos milhares de parâmetros disponíveis e ativar filtros que de outra forma não seriam acessíveis aos usuários quando o sistema reconhece uma necessidade.
Um caso único, mas bastante frequente, é quando as pessoas procuram uma categoria. Nesse caso, nós os redirecionamos para a página da categoria, direcionando assim para a página (frequentemente) com personalização manual com o conteúdo dependente do contexto do site de e-commerce, como banners, promoções, etc. Ou seja, resultado relevante para seus negócios atuais!
Nosso recurso, compreensão da consulta, pode reconhecer categorias, marcas e parâmetros de produtos, o que ajuda os clientes a obter resultados mais relevantes para consultas curtas. Está disponível para todos os nossos clientes.
Tomáš é CTO e co-fundador da Luigi's Box. Ele é doutor em Engenharia de Software de Computadores pela FIIT STU. Tomáš escreve artigos sobre tecnologias de pesquisa de ponta há mais de dez anos e trabalha continuamente para revolucionar o conceito de pesquisa e navegação para fornecer a melhor experiência possível para os usuários de pesquisa no site.
Mais posts de blog deste autor