Busca e Analytics

O Data Analytics e a Inteligência Artificial possibilitam ao departamento de TI a oportunidade de ter um papel ativo no desenvolvimento de uma cultura e gestão de dados.

Esse papel pode capacitar toda a organização a dar respostas eficientes e imediatas a desafios mais complexos, bem como garantir a eficiência e a fluidez operacional em todos os departamentos.

As soluções de Data Analytics e Inteligência Artificial trazem ao departamento de TI a oportunidade de terem um papel ativo no desenvolvimento de uma cultura e gestão de dados que capacitará toda a organização a dar respostas eficientes e imediatas a desafios mais complexos, bem como garantir a eficiência e a fluidez operacional em todos os departamentos.

Cada vez mais, as áreas de negócio solicitam mais dados, com mais frequência e em diferentes formatos para poderem realizar as suas análises e otimizarem as suas estratégias. Com soluções de Data Analytics e de Inteligência Artificial, os utilizadores de negócio ficam habilitados a fazerem as suas análises, ficando o departamento de TI com o controle administrativo e com foco no trabalho diferenciador.

Elasticsearch é onde a mágica da indexação, pesquisa e análise acontece.

  • Adicione uma caixa de pesquisa a uma aplicação ou website;
  • Armazene e analise registos, métricas e dados de eventos de segurança;
  • Use a aprendizagem da máquina para modelar automaticamente o comportamento dos seus dados em tempo real;
  • Automatize os fluxos de trabalho como motor de armazenamento;
  • Gira, integre e analise informação espacial como um sistema de informação geográfica (SIG);
  • Armazene e processe dados genéticos como ferramenta de investigação bioinformática.

Ficamos continuamente surpreendidos com as novas formas como as pessoas utilizam a pesquisa. Mas se o seu caso de utilização é semelhante a um destes, ou se está a utilizar Elasticsearch para resolver um novo problema, a forma como trabalha com os seus dados, documentos e índices em Elasticsearch é a mesma.

Embora se possa usar Elasticsearch como um armazém de documentos e recuperar documentos e os seus metadados, o verdadeiro poder vem de se poder aceder facilmente ao conjunto completo de capacidades de pesquisa construídas na biblioteca do motor de pesquisa Apache Lucene.

Elasticsearch fornece uma API REST simples e coerente para gerir o seu cluster e indexação e pesquisa dos seus dados. Para fins de teste, pode facilmente submeter pedidos diretamente a partir da linha de comando ou através da Consola de Desenvolvimento em Kibana. A partir das suas aplicações, pode utilizar o cliente Elasticsearch para a sua língua de escolha: Java, JavaScript, Go, .NET, PHP, Perl, Python ou Ruby.

Pesquisar a sua edição de dados

Suportam consultas estruturadas, consultas de texto completo, e consultas complexas que combinam as duas. As consultas estruturadas são semelhantes aos tipos de consultas que se podem construir em SQL.

Por exemplo, pode pesquisar os campos de gênero e idade no seu índice de empregados e ordenar os resultados pelo campo hire_date. As consultas de texto integral encontram todos os documentos que correspondem à cadeia de consulta e devolvem-nos ordenados por relevância – quão bons são para os termos da sua pesquisa.

Para além de procurar termos individuais, pode efectuar pesquisas de frases, pesquisas de semelhanças, pesquisas de prefixos, e obter sugestões autocompletas.

Tem dados geoespaciais ou outros dados numéricos que deseja pesquisar? A Elasticsearch indexa dados não textuais em estruturas de dados otimizadas que suportam consultas geo-espaciais e numéricas de alto desempenho.

Pode aceder a todas estas capacidades de pesquisa usando a linguagem de consulta abrangente ao estilo JSON da Elasticsearch (Query DSL). Pode também construir consultas ao estilo SQL para pesquisar e agregar dados nativamente dentro da Elasticsearch, e os drivers JDBC e ODBC permitem uma vasta gama de aplicações de terceiros para interagir com a Elasticsearch via SQL.

Analisando a sua edição de dados

As agregações do sistema permitem-lhe construir resumos complexos dos seus dados e obter informações sobre as principais métricas, padrões e tendências. Em vez de apenas encontrar a proverbial “agulha num palheiro”, as agregações permitem-lhe responder a perguntas como:

  • Quantas agulhas estão no palheiro?
  • Qual é o comprimento médio das agulhas?
  • Qual é o comprimento mediano das agulhas, repartido por fabricante?
  • Quantas agulhas foram adicionadas ao palheiro em cada um dos últimos seis meses?

Também se podem utilizar agregações para responder a perguntas mais subtis, como por exemplo:

  • Quais são os seus fabricantes de agulhas mais populares?
  • Existem tufos de agulhas anómalos ou invulgares?

Porque os agregados aproveitam as mesmas estruturas de dados utilizadas para a pesquisa, são também muito rápidos. Isto permite-lhe analisar e visualizar os seus dados em tempo real. Os seus relatórios e dashboards são atualizados à medida que os seus dados mudam, para que possa tomar medidas com base nas informações mais recentes.

Além disso, as agregações funcionam juntamente com os pedidos de pesquisa. Pode pesquisar documentos, filtrar resultados e realizar análises ao mesmo tempo, com os mesmos dados, num único pedido.

E porque as agregações são calculadas no contexto de uma determinada pesquisa, não está apenas a exibir uma contagem de todas as agulhas de tamanho 70, está a exibir uma contagem de agulhas de tamanho 70 que correspondem aos critérios de pesquisa dos seus utilizadores – por exemplo, todas as agulhas de tamanho 70 sem bordar.

Mas espere, há mais

Deseja automatizar a análise dos seus dados de séries cronológicas? Pode utilizar características de aprendizagem de máquinas para criar linhas de base precisas de comportamento normal nos seus dados e identificar padrões anômalos. Com a aprendizagem de máquinas, pode detectar:

  • Anomalias relacionadas com desvios temporais em valores, contagens, ou frequências;
  • Raridade estatística;
  • Comportamentos pouco usuais para um membro de uma população.

E a melhor parte? Pode fazer isto sem ter de especificar algoritmos, modelos, ou outras configurações relacionadas com a ciência dos dados.

Menu