Blog

Destaque

Tudo na palma da mão

Além da comodidade oferecida pelo mobile, os consumidores buscam segurança

Resumo do post:

  • os consumidores buscam segurança nas operações financeiras realizadas no dispositivo móvel
  • o número de transações financeiras via mobile banking cresceu cerca de 50% de 2017 para 2018 e o Brasil é o 4º maior mercado de apps do mundo
  • a tecnologia é uma importante aliada no combate à fraude:  inteligência artificial e análise da dados.

Comodidade, praticidade, informação e diversão. Tudo na palma na mão dos consumidores. O mundo está mobile. Depois que os smartphones ganharam importância e relevância no dia a dia dos brasileiros, tornou-se frequente novos lançamentos e atualizações nesse mercado.

Para se ter uma ideia, o Brasil é o 4º maior mercado de apps do mundo, segundo pesquisa apresentada pela APP Annie Forecast 2016-2021. Além das facilidades permitidas pelo aparelho móvel, os consumidores buscam também por segurança. E muitas vezes, quando pensamos no mobile, dificilmente lembramos das fraudes.

O mercado financeiro acompanhou essa transformação digital e assim houve um grande crescimento do mobile banking no Brasil. O gráfico abaixo apresenta uma comparação entre o uso de banco pelo celular em comparação com outros tipos de acesso como internet banking, ATM e agências bancárias.

 composição das transações bancárias por canal (em %)

Os dados são da Pesquisa Febraban de Tecnologia Bancária 2019

Para exemplificar a velocidade de crescimento do mobile banking, o número de transações por meio desse canal em 2018 foi praticamente o dobro da realizada em 2016. O total foi de 31,8 bilhões contra os 18,6 bilhões registrados em 2016.

A comodidade de efetuar as operações por um dispositivo na palma da mão explica esse avanço. Além da praticidade e da busca por melhores experiências, os consumidores buscam segurança.

E com o aumento das transações no mobile, aumentam também o número de fraudes e as formas como elas são realizadas.

Como a tecnologia ajuda na segurança do usuário?

Hoje em dia a tecnologia já te possibilita, em tempo real, avaliar a identidade do cliente e prevenir a fraude. A Inteligência Artificial, análise de dados e estudo do comportamento do consumidor são fatores fundamentais nesse processo e que ajudam a garantir a segurança das partes envolvidas em todas as operações financeiras.

Para otimizar custos, tempo e prezar pela reputação é importante que as instituições financeiras fiquem sempre atentas as soluções tecnológicas para lidar com essas ameaças.

O futuro está na personalização da experiência

Melhore suas ações de marketing, vendas e atendimento por meio dos dados

Empresas de diferentes segmentos têm enxergado nos dados um ativo importante para conhecer melhor o comportamento do seu consumidor e, também, para manter a lucratividade e segurança de seu negócio. Especialmente nos segmentos de negócios com amplo foco no consumidor como os do mercado de varejo, financeiro, comunicação, automobilístico, aviação e marketing. Nestes setores é possível encontrar padrões de consumo, preferências e tendências e, dessa forma, produzir relatórios que são essenciais para tomadas de decisões mais estratégicas, sem “achismos”.

Com o avanço da tecnologia e da inteligência artificial, abriu-se um mundo de possibilidades nos processos de entender melhor o comportamento do consumidor e desenhar estratégias para que eles cheguem até a sua marca, tenham uma jornada de compra satisfatória e mantenham-se fiéis a ela.

Talvez a AI ainda seja novidade no cotidiano da sua empresa, mas isso não vale para seus consumidores. Eles já usam aplicativos para comparar e localizar preços. A inteligência artificial permite mais eficiência e assertividade na criação de novos produtos, ações de marketing, vendas e no próprio atendimento.

O interesse das empresas em conhecer seus clientes não é algo novo: a boa e velha pesquisa de opinião está aí para provar isso. A diferença, porém, é que agora a produção de informações evoluiu e é gerada em tempo real, ajudando a criar valor a partir da oportunidade do conhecimento do público-alvo e de seu padrão de comportamento que interferem nas decisões de compra e de negócios.

É possível ir além de dados unidimensionais – como idade, sexo e profissão – e saber quais conteúdos aquela pessoa consome, seu padrão de compra e comportamento na web. Assim, os dados gerados pelos usuários podem ser usados de uma maneira muito mais específica e estratégica para definição de ações de marketing futuras.


A quantidade de informações produzidas hoje em computadores e smartphones continuará crescendo e, com ela, a complexidade de analisá-las. A inteligência artificial ajuda sua empresa a tomar decisões melhores ao analisar e comparar grandes volumes de informações e organizá-los de forma relevante.

Em um mundo bombardeado por dados, atuar com inteligência e eficiência com as informações não é mais simplesmente um diferencial, é a nova regra do jogo. Compreender as preferências do público influencia nos processos decisórios de diferentes setores do negócio, fazendo com que a empresa tenha mais vantagem competitiva e se torne relevante para os clientes.

O fim do achismo nas empresas

A importância dos dados para conhecer melhor a sua persona

Praticamente ninguém poderia imaginar, há décadas atrás, que hoje estaríamos usando aplicativos para quase tudo. Pedir comida sem ter que ligar para o restaurante, fazer transações bancárias no meio da madrugada e chamar o transporte com um clique. A tecnologia tem transformado radicalmente nossa relação com produtos e serviços. Se os consumidores estão cada vez mais adeptos às comodidades proporcionadas pelos aplicativos de dispositivos móveis, é fundamental que as empresas utilizem o comportamento dos usuários de maneira estratégica.

Todos os dias, uma quantidade enorme de dados digitais é gerada e é fundamental que empresas consigam lidar com essas informações para entender melhor o comportamento do seu consumidor. Se antes esses processos eram feitos de forma quase manual, usando pesquisas de opinião e formulários em papel, hoje é possível conhecer não apenas informações unidimensionais dos usuários – como idade, profissão e sexo – mas também entender seus gostos, hábitos de consumo e outras informações valiosas para o seu negócio.

É uma tendência que desperta interesse e está na lista de prioridades das companhias. Segundo o relatório Global Mobile Analytics Market 2016 – 2020, o investimento das empresas em soluções de análise e inteligência para smartphones foi de US$ 1,62 bilhões em 2015 e deve ser de US$ 4,26 bilhões em 2020.

Não é à toa que esses números crescem. A inteligência artificial ajuda empresas a tomarem decisões melhores ao analisar e comparar grandes volumes de informações e organizá-los de forma relevante. Isso reflete em novos produtos, ações de marketing, vendas e até no atendimento.


A quantidade de informações produzidas em computadores e smartphones continuará crescendo e, com ela, a complexidade de analisá-las. Conseguir compreender as preferências do público influencia, portanto, processos decisórios de diferentes setores do negócio, fazendo com que a empresa tenha mais vantagem competitiva e se torne relevante para clientes.

Toda essa onda de avanços tecnológicos também gera mudanças sociais e estimula a criação de novas regras, que visam proteger o cidadão e definir condições de uso desses dados pelas empresas. Um ótimo exemplo é a Lei Geral de Proteção de Dados (LGPD), que vigora em 2020 e já faz com que empresas busquem alternativas de segurança e privacidade para clientes.

A privacidade dos usuários é tema fundamental neste processo de inovação e deve ser tratada com total prioridade. A LGPD é um marco muito importante neste processo.

Com este cenário regulatório, considerando que as regras de tratamento de dados estão claras, empresas e clientes podem se beneficiar dos avanços que essas tecnologias podem trazer. 

Esse artigo foi originalmente publicado no Jornal Hoje em Dia.

Cooperação é a marca que evidencia a relação entre grandes bancos e startups

Conheça 4 benefícios dessa parceria

Atualmente, a relação entre bancos e startups é bastante positiva, várias barreiras foram vencidas e é possível perceber como a sinergia entre esses dois mundos é valiosa e como essa troca beneficia as empresas envolvidas, o mercado, a sociedade e os clientes.

Juntas, as grandes e as pequenas, somam uma força transformadora que impulsiona a inovação. De uma forma geral, pode-se dizer que as grandes corporações e as startups têm características de negócios complementares.

A partir desse entendimento, as empresas mais tradicionais têm aberto as portas para receber as pequenas empresas por meio de programas de open inovation. O que elas buscam é a transformação que as empresas disruptivas agregam nos processos muitas vezes morosos e burocráticos. Conheça 4 ganhos gerados por esse trabalho colaborativo:

1. Inovação: esse é o grande ponto dessa parceria. A inovação injeta uma nova cultura de testar, errar e ajustar muito rapidamente. As grandes empresas estão tão focadas no seu core business que não sobra muito tempo e recurso para dedicar-se à inovação. Com o foco nas necessidades do cliente, os processos e as soluções são customizadas e adaptadas de forma mais eficiente: nos custos, no tempo e nos resultados. 

2. Agilidade: uma startup consegue desenvolver e testar uma solução rapidamente. Nesse ambiente ágil, o erro e a rápida correção fazem parte do processo de desenvolvimento e criação. Agilidade nas definições nessas estruturas pouco engessadas são muito benéficas nesse mundo dinâmico e transformador.

3. Conhecimento: anos de mercado das grandes corporações são importantes para influenciar as startups com processos e maturidade. Além disso, a empresas menores se beneficiam com a grande base de clientes e, assim, conseguem escalonar de forma mais rápida. De um lado, as startups conseguem somar com conhecimento da cultura da inovação e do outro lado, aprendem com os processos e estruturas bem formatadas, característico das grandes empresas.

4.Governança: no primeiro item falamos sobre como as startups contribuem ao injetar inovação ao negócio e aos processos. A governança é um atributo que colabora muito para a consolidação e crescimento das empresas pequenas. É preciso maturidade para navegar nas áreas das grandes empresas e esse trabalho conjunto contribui de forma muito positiva para que as startups desenvolvam essa visão.

É possível unir forças em prol do consumidor e da sociedade. O cliente tem buscado experiências mais transparentes, personalizadas, ágeis e inovadoras. Esse trabalho em sintonia e essa experiência colaborativa já é uma realidade e exigência do mercado. Se por um lado há a entrega de inovação do outro, existe o aprendizado com governança e escalabilidade.

Sejamos cooperativos e inovadores!

 

Conhecer o seu cliente é a melhor oportunidade que a sua empresa pode ter

Gerar insights de comportamento pode proporcionar grandes inovações

Um dos maiores desafios das empresas é conhecer e antecipar as necessidades dos seus clientes: anseios, desejos e oportunidades de melhoria. O mercado e a sociedade estão cada vez mais exigentes e segundo uma pesquisa da CEI Survey, a busca por experiências especiais e únicas será o grande diferencial das marcas.  

“…até 2020 a experiência do cliente superará o preço e o produto como diferenciador-chave da marca – 86% dos compradores pagarão mais para terem uma melhor experiência.”

Recentemente, a PwC divulgou a Global Consumer Insights Surveys que apresentou um novo termo que reafirma a importância de um excelente contato do consumidor em toda a jornada de compra: ROX – Retorno Sobre Experiência.

“Os consumidores de hoje são muito criteriosos e poderosos, por isso entendemos que a maioria das organizações precisa investir muito mais em experiência do consumidor… 

….Não importa se a sua organização está no negócio de eletrodomésticos, serviços de saúde, venda de carros ou serviços financeiros, oferecer uma experiência avançada é o que te trará destaque entre os competidores.”

A partir dessa análise, como oferecer produtos e serviços que atendam esses anseios e exigências desse novo perfil de consumidor – que além de qualidade, busca também uma relação mais personalizada e assertiva? Conhecer sobre a sua persona é o primeiro passo.

Entender com quem se fala, compreender seus hábitos e preferências te ajuda a capturar insights e informações valiosas para a tomada de decisões.

Com a transformação digital e o big data, tornou-se possível avaliar, cruzar e obter dados que ajudam nas definições do negócio e que impactam positivamente a sua relação com o seu consumidor.

A relevância dos dados não gira em torno da quantidade, até porque a cada instante surgem novas formas e meios de gerar dados. O que vão diferenciar as empresas e elevar a experiência e o relacionamento com o cliente para outro patamar são 2 definições importantes: fontes adequadas e o que fazer com os dados.  

Ao combinar big data com inteligência analítica é possível entender o comportamento do consumidor para: comunicar de forma personalizada, melhorar a experiência do usuário, aumentar retenção e mitigar o risco de fraude.

Trabalhar com essa inteligência de dados é como ter o briefing bem completo e afinado – você vai conhecer melhor o seu consumidor, as suas preferências e hábitos. Existem insights sobre o seu cliente que podem mudar e impactar positivamente os seus resultados.

Capturar insights de comportamento podem gerar grandes inovações. Conheça melhor o seu cliente e utilize essas estratégias para gerar valor ao seu negócio: otimização de custos, personalização do relacionamento, fidelização à marca, entendimento do mercado e concorrentes e efetividade das campanhas de marketing.

Acesse: cinnecta.com/soluções

Será que você realmente sabe quem é o seu cliente?

O desafio é entender o seu real comportamento

Está cada vez mais complexo entender e compreender o cliente. Existe uma infinidade de canais disponíveis, dados gerados, variáveis envolvidas e fatores que colaboram na definição do perfil de um cliente.

São múltiplas possibilidades e hoje, por exemplo, não é suficiente saber que o seu consumidor é do sexo masculino para fazer uma comunicação assertiva. Há os que são casados, os que moram sozinhos, os que gostam de viajar e os que preferem uma tarde no Netflix.

De um lado, temos consumidores cada vez mais exigentes, com um perfil mais cuidadoso e seletivo. Ele está cada dia mais avesso à interrupções e estratégias de relacionamento invasivas. Do outro lado, temos marcas e empresas buscando entender de forma mais relevante com quem ela está dialogando.

As formas de pesquisa para conhecer o cliente aumentaram e os canais para diálogo cresceram absurdamente. Ao mesmo tempo, o barulho e ruído neste contato também se multiplicaram. Nesse contexto, as empresas que desejam ser relevantes para o seu público precisam identificar padrões de comportamento, saber verdadeiramente com quem estão conversando e assim estreitar a comunicação com o consumidor final.

Não raro nos dias de hoje em que a tecnologia facilita a comunicação com o cliente, as interações e ações de engajamento entre as organizações e o seu público muitas vezes não geram o resultado esperado porque são realizadas no canal, momento e mensagem inadequados.

Personalização e assertividade

As pessoas buscam ser tratadas de forma exclusiva, valorizam experiência de compra, são bem informadas e são frequentemente impactadas por concorrentes. O cliente está em constante renovação e na pesquisa por melhores conexões com marcas e empresas. É preciso saber com quem se fala para progredir em proximidade, simplicidade e fidelização. Construir esse relacionamento com o cliente de forma personificada tornou-se imprescindível para manter uma relação pessoal.

Entender o histórico de relacionamento e realizar uma análise de comportamento do cliente é fundamental e vai te ajudar a basear suas próximas decisões e estratégias em dados mais inteligentes. Capturar insights de comportamento podem gerar grandes inovações. Conhecer o seu cliente é a melhor oportunidade que a sua empresa pode ter.

Fica evidente que, em um cenário em que as possibilidades de contato com o cliente são inúmeras, não dá para fazer um approach descontextualizado. É preciso avaliar os hábitos e preferências do seu consumidor, buscar um maior entendimento de suas necessidades, promover melhores experiências de relacionamento a partir de um relacionamento pessoal e eficaz.

O foco em entender o consumidor e a sua rotina, locais que visita, estilo de vida, é a nova aposta para relacionamentos personalizados, oportunidades de negócios e diálogos assertivos.

Agrupamento não-supervisionado

Aprenda a avaliar a qualidade de um cluster

O mundo de Big Data possibilitou a extração de conhecimento útil a partir de dados coletados. Uma forma bastante utilizada para conhecer os usuários de algum serviço é agrupá-los de acordo com uma ou mais features, utilizando técnicas não-supervisionadas do aprendizado de máquina, muitas vezes referidas simplesmente como clustering. Esse agrupamento pode facilitar a descoberta de características de usuários similares e importantes. Tais características nem sempre são fáceis de serem identificadas, mesmo em análises mais profundas, uma vez que a diversidade dos dados pode causar interferência nos resultados de outras técnicas.

O primeiro desafio é categorizar os clientes de acordo com as features desejadas. Tais features podem ser obtidas através de cálculos matemáticos, identificação de padrões ou através de outro conjunto de características. Um outro desafio que merece atenção é a presença de outlier, uma vez que a utilização de algumas métricas estatísticas são sensíveis a valores muito fora do padrão.


Outlier em um Agrupamento

Nem sempre os outliers são simples de serem removidos, principalmente se estes forem esparsos entre si e com poucas características em comum. Em alguns tipos de features numéricas, este caso se agrava, pois é difícil classificar um valor como outlier sem maiores estudos. Com os dados ordenados, poderíamos por exemplo, decidir retirar uma porcentagem de dados do final da nossa estrutura, mas qual o valor percentual mais adequado? Ele representa bem os outliers? Será que não estamos removendo poucos ou muitos dados? Somente os outliers demandam um estudo próprio e a solução encontrada pode ser adequada para o conjunto de dados atuais. Mas será que a solução continuará eficaz com uma leve mudança nos dados? É por este motivo que muitas vezes é preferível manter os outliers, visto que a sua retirada pode resultar em uma melhoria muito baixa se comparada ao trabalho demandado. Para se chegar a uma conclusão sobre a remoção de outliers, é indicado uma avaliação de qualidade dos clusters.

A avaliação de qualidade vai mostrar possíveis inconsistências no agrupamento obtido, possibilitando uma maior compreensão dos dados e resultados, e consequentemente impedindo que tais inconsistências sejam tratadas como conhecimento. Uma inconsistência pode levar a tomada de decisão baseada em uma situação não condizente com a realidade, e isso pode custar caro! Apesar da importância de uma avaliação da qualidade dos clusters, ainda é difícil encontrar conteúdo para auxiliar nessa avaliação. Mesmo com todo o estudo e aprimoramento dos algoritmos existentes, nem sempre os clusters obtidos são considerados “bons”.

Teoricamente, uma boa clusterização possui grupos compostos por dados próximos entre si (baixa distância intra-cluster), e bem distantes em relação aos dados de outros grupos (alta distância inter-cluster). Em alguns casos, também é esperado que os grupos possuam aproximadamente o mesmo tamanho e que seus centróides, ou seja, o ponto médio de seus dados, sejam bem separados. Existem outras métricas que podem ser aplicadas para avaliação de um agrupamento (Coeficientes de Silhueta (en.wikipedia.org/wiki/Silhouette_(clustering)) e outros) , porém neste artigo trataremos apenas das métricas citadas anteriormente.

Distância entre Pontos

A primeira métrica que falaremos é a que prevê a medição entre os pontos de um agrupamento. Esse cálculo é aplicado em duas frentes: é calculada a distância entre os pontos de um mesmo grupo (distância intra-cluster) e a distância entre pontos de grupos distintos (distância inter-cluster).

        A distância intra-cluster irá representar o quão bem relacionados estão os dados. Ou seja, dados altamente relacionados estão mais próximos entre si do que dados com pouca relação.

Distância intra-cluster

Na figura acima vemos que os dados do cluster rosa claro seriam os mais bem relacionados entretanto, o outlier faz a distância média entre os pontos do cluster aumentar. Os pontos do cluster roxo são mais separados que os do grupo rosa, porém a relação entre seus pontos ainda é maior do que a do grupo de cor azul. Vemos então, que quanto menor a distância média intra-cluster, melhor o seu grupo será.

Porém, como podemos imaginar, somente estes valores não serão capazes de representar bem o agrupamento. É aqui que entra os valores de distância inter-clusters. Estes valores são obtidos através do cálculo da menor distância entre dois pontos de clusters distintos.

distância entre clusters

No mesmo exemplo, vemos que a distância entre os grupos roxo e rosa é maior que a distância entre os grupos roxo e azul. Isso acontece porque os dados presentes no cluster rosa são menos relacionados com os dados do cluster roxo do que os dados do cluster azul. Assim, vemos que quanto maior a distância inter-cluster, melhor será o agrupamento.

Porém, existem casos em que os grupos obtidos possuem tantos dados e eles são tão próximos entre si, que a aplicação desta métrica se torna, se não inviável, não tão precisa quanto deveria. Nestes casos, podemos utilizar o cálculo da distância entre centróides.

Distância entre Centróides

Os centróides são os pontos médios de um cluster, ou seja, é um ponto localizado no centro de massa de um grupo, onde existe uma maior concentração de dados. Esta é uma técnica que pode ser utilizada quando existem muitos dados e estes são relativamente próximos de pontos de outro grupo.

Distância entre os centróides dos clusters

Como vemos na figura acima, apesar da pouca distância entre os clusters azul e roxo, a distância entre seus centróides é tão grande quanto, se não maior, que a distância entre os centróides dos clusters roxo e rosa. Isso significa que, apesar de alguns dados dos grupos azul e roxo serem relacionados, essa relação não representa a maior parte dos elementos desses grupos.

Essa técnica pode ser atrelada à uma análise de pontos de fronteira, como descrito a seguir.

Densidade de Pontos na Fronteira

A análise de pontos de fronteira é uma técnica que busca calcular e estudar a densidade de pontos entre dois centróides, especificamente aqueles pontos localizados bem no meio dessa distância. Essa análise pode ser aplicada quando a distância inter-cluster é baixa, para verificar se, apesar disso existem poucos pontos na fronteira entre os clusters.

Quantidade de Pontos na Fronteira entre os Clusters

No mesmo exemplo, vemos que é apenas um ponto na fronteira entre os grupos azul e roxo que faz com que a distância inter-cluster seja pequena, logo o agrupamento não é ruim como parecia.

Tamanho dos Clusters

A última métrica prevê a análise da quantidade de pontos em um cluster. Em muitos casos, um bom agrupamento deve possuir grupos homogêneos, inclusive em seu tamanho. Para realização deste cálculo pode ser utilizada a Entropia de Shannon, dada pela fórmula abaixo:

H(X) = -i=1np(xi)logbp(xi)

No qual representa a probabilidade de se escolher o dado i no conjunto de dados X e b a base escolhida para o logaritmo. O resultado deste cálculo será um valor entre 0 e 1. Para uniformizarmos este intervalo, vamos dividir o resultado da entropia por e teremos sempre um valor no intervalo fechado entre 0 e 1. Quanto maior o valor da entropia, mais bem distribuído e homogêneo é o agrupamento.

Então pessoal, todas as técnicas têm seus prós e contras e estes devem ser avaliados antes de sua aplicação.


Análise Exploratória de Dados Geoespaciais

Localização de Usuários Móveis

Nos últimos anos, notou-se um crescimento significativo na coleta de dados de localização de usuários móveis. Com isso, a indústria e a academia estão investindo cada vez mais em soluções que possibilitem a extração de conhecimento útil a partir desses dados.

As localizações dos usuários móveis são fontes importantes de informação para a chamada computação urbana, que visa melhorar a qualidade de vida dos cidadãos em termos de mobilidade, qualidade do ar e infraestrutura de tecnologia. Ao se conhecer as características geoespaciais dos usuários de uma cidade e clientes de uma empresa, por exemplo, é possível, além de oferecer melhores serviços, ofertar soluções mais personalizadas e cientes do contexto atual em que os usuários se encontram.

Existem vários desafios que tornam a extração de conhecimento a partir de dados geoespaciais não-trivial. Primeiramente, a coleta desses dados deve ser com uma certa frequência que permita que resultados precisos sejam alcançados, sem consumir os recursos de energia e comunicação dos usuários. Além disso, deve-se ter cuidado com a precisão dos dados, já que mesmo o GPS possui uma margem de erro que aumenta em ambientes fechados ou com muitos obstáculos. Considerando o grande número de usuários, o armazenamento e tratamento desses dados devem ser eficientes, para que grandes volumes de dados possam ser utilizados pelos algoritmos.

Além dos desafios técnicos, deve-se tomar alguns cuidados devido às características dos dados. Em geral, dados geoespaciais referem-se a dois valores representando a latitude e longitude que indicam uma posição na Terra. Esses valores são medidos em graus (exemplo: 19°55’54.5″S 43°56’16.8″W), sendo na maioria das vezes descritos em valores decimais, em que os minutos e segundos são convertidos para valores decimais e o sinal indica o hemisfério (exemplo: -19.931803, -43.938012).

Vale destacar que a diminuição da precisão de uma latitude ou longitude leva a um aumento no erro da localização, sendo que esse erro varia de acordo com a localização ao longo da Terra.

Conheça duas estratégias essenciais para a análise exploratória de dados geoespaciais.

Cálculo de Distâncias

Antes de apresentar as técnicas de análise, é importante falar um pouco sobre o cálculo de distâncias entre duas localizações.

Muitas vezes, é preciso calcular a distância entre dois pontos. Como exemplo, pode-se citar o estudo para implantação de uma antena de celular, o cálculo de estimativa de deslocamento de um usuário móvel e uma análise de contatos entre usuários. Para isso, é preciso ficar atento e lembrar que a Terra é redonda (não é uma esfera perfeita, e isso é pauta para outro momento), e que o cálculo de distância em uma esfera é diferente de um plano. Ou seja, a não ser que as distâncias sejam pequenas ou que uma margem de erro alta seja aceitável, a distância Euclidiana não será precisa. No entanto, cientistas já definiram fórmulas para o cálculo dessa distância, sendo a distância Haversine (en.wikipedia.org/wiki/Haversine_formula) a mais famosa por ser eficiente computacionalmente e muito precisa.

Vale destacar que esse cálculo retorna a distância em linha reta e que muitas vezes o deslocamento feito por um usuário está longe de ser uma linha reta. Em outras palavras, para se analisar dados de mobilidade e trajetória de usuários, é preciso mais do que isso. Uma solução é transformar o mapa viário de uma cidade de interesse em um grafo onde as arestas representam as vias de deslocamento e os vértices representam as interseções entre essas vias, e utilizar algoritmos de grafos para estudar as trajetórias, traçar o caminho mais curto e definir as melhores rotas, por exemplo. Para isso, uma alternativa é utilizar o excelente projeto colaborativo chamado OpenStreetMap (openstreetmap.org), que fornece detalhes de mapas em formatos que podem ser trabalhados computacionalmente.

Análise Exploratória

Com os dados geoespaciais em mãos, é importante fazer uma primeira análise exploratória para se ter uma visão geral dos dados. Seguem algumas dicas e técnicas:

  • Como em toda análise de dados, é preciso inicialmente limpar e remover ruídos que possam interferir nos resultados. Essa tarefa envolve, por exemplo, remover dados com localizações nulas ou inconsistentes. Também pode ser necessário fazer um filtro de uma região de interesse. Caso essa região seja um círculo, é suficiente definir o centro e o raio do círculo para remover localizações fora dele. Caso a região de interesse seja uma outra forma geométrica qualquer, é preciso utilizar alguma API específica, como por exemplo a Shapely para Python (pypi.org/project/Shapely).
  • Após limpar e filtrar os dados, é possível visualizar os mesmos em um mapa, para que sejam observados alguns padrões. Uma primeira forma bem simples é plotar todos os pontos no mapa. Essa estratégia funciona bem com poucos pontos, mas não agrega valor algum quando grandes volumes de dados são utilizados (como o mapa abaixo):
  • Uma outra estratégia que ajuda a visualizar a distribuição dos pontos é o chamado Mapa de Calor (heatmap). Esse mapa mostra onde os pontos estão concentrados de forma mais abrangente. Porém, nem sempre é possível visualizar as características de regiões mais específicas e menores.
  • Para se ter mais detalhes de uma região específica, o agrupamento por densidade de pontos pode também ajudar. Nessa técnica, pontos próximos são agrupados e a densidade do grupo é apresentada, indicando os locais mais densos de forma quantitativa.
  • Uma última alternativa que permite que se tenha uma visão mais detalhada é separar a área de interesse do mapa em quadrantes, e calcular a densidade para cada quadrante. Com isso, é possível escolher o tamanho ideal do quadrante para cada caso, e a coloração do mapa de calor indicará mais precisamente os locais mais e menos densos. Para essa solução, também é necessário utilizar alguma API de manipulação de formas geométricas, como a Shapely para Python.
  • Em muitas análises, além da dimensão espacial, a dimensão temporal também é relevante. Ou seja, tem-se interesse em verificar pontos espaciais ao longo do tempo. Para que essa análise seja feita, uma opção é fazer snapshots em intervalos de tempo definidos, gerando várias imagens ao longo do tempo. Esse intervalo de tempo pode ser tão curto quanto necessário, gerando um número muito grande de imagens, que podem então ser combinadas em um vídeo.

E para fechar:

É notável a existência de grandes volumes de dados geoespaciais coletados de dispositivos móveis. Esse contingente será ainda maior em um futuro próximo, quando veículos autônomos e a Internet das Coisas estiverem consolidados e mais facilmente acessíveis. Apesar de ajudarem na extração de conhecimento, as técnicas existentes ainda podem ser melhoradas e otimizadas. Portanto, existe um grande desafio de pesquisa e desenvolvimento para que seja possível obter o máximo de informação útil a partir de grandes volumes de dados brutos de localização.

Na Cinnecta, em parceria com a UFV, buscamos sempre a inovação e por isso avaliamos constantemente novas técnicas e algoritmos que auxiliem nessa tarefa.