A Memora Processos Inovadores atua com parcerias estratégicas de âmbito internacional para oferecer soluções de acordo com a necessidade de cada cliente. Temos diversos cases de sucesso como o uso da Elasticsearch, que possibilita realizar indexação, pesquisa e análise.
- Adicione uma caixa de pesquisa a um aplicativo ou site;
- Analise e armazene registos, métricas e dados de eventos de segurança;
- Use a aprendizagem da máquina para moldar automaticamente o comportamento de seus dados em tempo real;
- Automatize fluxos de trabalho como motor de armazenamento;
- Gire, integre e analise informação espacial como um sistema de informação geográfica (SIG);
- Armazene e processe dados genéticos como ferramenta de investigação bioinformática.
Somos continuamente surpreendidos com as novas maneiras de como as pessoas usam a pesquisa. Porém, se o seu caso de utilização é parecido com um dos citados acima, ou se utiliza Elasticsearch para solucionar um novo problema, o modo como trabalha com seus dados, documentos e índices em Elasticsearch é a mesma.
Embora se possa usar Elasticsearch para armazenagem de documentos e para recuperar a eles e aos seus metadados, seu verdadeiro diferencial vem de se poder aceder facilmente ao conjunto completo de capacidades de pesquisa construídas na biblioteca do motor de pesquisa Apache Lucene.
Elasticsearch fornece uma API REST simples e coerente para gerenciar seu cluster e a indexação e pesquisa dos seus dados. Para fins de teste, é possível facilmente submeter pedidos diretamente partindo da linha de comando ou por meio do Console de Desenvolvimento em Kibana. A partir de suas aplicações, pode-se utilizar o cliente Elasticsearch em sua linguagem de escolha: Java, JavaScript, Go, .NET, PHP, Perl, Python ou Ruby.
Pesquisar sua edição de dados
Suportam consultas estruturadas, consultas de texto completo e consultas complexas que combinam ambas. As consultas estruturadas são parecidas com os modelos de consultas construídos em SQL.
É possível, por exemplo, pesquisar campos de gênero e idade em seu rol de colaboradores e ordenar os resultados obtidos pelo campo hire_date. As consultas de texto integral encontram todos os documentos que correspondem à cadeia de consulta e os devolvem ordenados por relevância de quão assertivos são para os termos da pesquisa realizada.
Além de buscar por termos individuais, é possível efetuar pesquisas de frases, semelhanças, e prefixos, e ainda conseguir sugestões autocompletas.
Existem dados numéricos ou geoespaciais que gostaria de pesquisar? A Elasticsearch indexa dados não textuais em estruturas otimizadas que suportam consultas geoespaciais e numéricas com alto desempenho.
Pode-se acessar a todas essas capacidades de pesquisa usando linguagem de consulta abrangente em formato JSON da Elasticsearch (Query DSL). É possível ainda construir consultas em estilo SQL para pesquisar e agregar dados nativamente dentro dela. Os drivers JDBC e ODBC permitem também vasta gama de aplicativos de terceiros para interagir com a Elasticsearch via SQL.
Analisar sua edição de dados
Os agregados do sistema lhe permitem construir resumos complexos de seus dados, obtendo informações a respeito das principais métricas, padrões e tendências. Ao invés de apenas encontrar a proverbial “agulha no palheiro”, é possível responder a perguntas como:
- Quantas agulhas estão perdidas no palheiro?
- Qual é o comprimento médio de todas as agulhas?
- Qual é o comprimento médio das agulhas, separadas por fabricante?
- Quantas agulhas foram perdidas no palheiro em cada um dos últimos seis meses?
É também possível usar agregados para responder a perguntas mais genéricas, como:
- Quais são os fabricantes de agulhas mais populares?
- Existem grupos de agulhas atípicos ou incomuns?
Como os agregados aproveitam as mesmas estruturas de dados utilizadas para a pesquisa, eles acabam sendo bastante rápidos. Isso permite que analisem e visualizem seus dados em tempo real. Seus relatórios e dashboards são atualizados à medida em que seus dados mudam, para que as medidas sejam tomadas com base nas informações mais recentes possíveis.
Além disso, os agregados funcionam conjuntamente com as solicitações de pesquisa. É possível, ao mesmo tempo, pesquisar documentos, filtrar resultados e realizar análises com os mesmos dados, em uma só solicitação.
E como as agregações são calculadas no contexto de determinada pesquisa, não apenas exibe uma contagem de todas as agulhas de tamanho 70, como também uma contagem de agulhas tamanho 70 que correspondem aos critérios de pesquisa dos usuários, como todas as agulhas tamanho 70 para bordar.
Se você deseja, por exemplo, automatizar a análise dos seus dados de séries cronológicas, pode usar características de aprendizagem de máquinas para criar linhas de base precisas de comportamento normal nos seus dados e identificar padrões anômalos. Com a aprendizagem de máquinas, é possível detectar:
- Anomalias relacionadas a desvios temporais em valores, contagens ou frequências;
- Raridade estatística;
- Comportamentos pouco usuais para um membro de determinada uma população.
E a melhor parte é que se pode fazer isso sem ter que especificar algoritmos, modelos ou outras configurações relacionadas com a ciência dos dados.