Desafios frente ao Big Data

Dados, dados por todos lados, mas nem um único pensamento sobre o qual refletir.
Theodore Roszak


Hoje em dia é impossível imaginar uma vida sem os telefones inteligentes conectados à internet. Com mais de 8,500 milhões de aparelhos, ou seja, 112 para cada 100 habitantes que há no mundo, pode-se afirmar que atuam como uma extensão do corpo, sem a qual a nossa vida cotidiana naufragaria.

Estão tão conectados a nós que cada dispositivo eletrônico poderia contar toda a história de uma pessoa com a informação que colhe. No entanto, a quantidade de informação que hoje é produzida aumenta sob o emblema dos três “v”: variedade, velocidade e volume. É como se um tsunami de dados chegasse a um embarcadouro e tornasse impossível capturar alguma “presa” significativa com as “redes” habituais.

O Big Data se refere não somente a um enorme conjunto de dados, mas à habilidade de manejá-los. Ou, como é chamado por Viktor Mayer: “a capacidade crescente de calcular vastas coleções de informação, analisá-las instantaneamente e tirar conclusões profundas delas”.[I] Isto é de grande relevância —e urgente— se considerarmos que em 2025 a geração mundial de dados chegará a 165 Zettabytes (1 ZB igual a um bilhão de Terabytes).[I]


O tamanho do mercado

Um estudo de Market Watch revelou que os vendedores de Big Data obtiveram em 2014 lucro de 30,000 milhões de dólares; a mesma empresa prevê que o investimento de Big Data chegará a 76,000 milhões de dólares em 2020. Por sua vez, LinkedIn calcula que o mercado mundial de Big Data atingiu, em 2018, o valor de 48,300 milhões de dólares.[III]

A produção de informação atual já ultrapassou todo padrão de análises. O Google reflete uma parte deste fenômeno ao processar 20 Petabytes (10 bytes15) por dia.[IV] O processamento de dados massivos é requisito para que tenham algum valor; somente desta forma permitem construir um conhecimento relevante que ajudará a reduzir a incerteza na tomada de decisões, para o desenho de uma estratégia ou a melhora de um processo, entre outros.

Visto que estas fontes de dados ajudam as empresas e governos a tomar decisões relevantes para o futuro, a sua análise se traduz em áreas de oportunidade que já começaram a render lucros a partir da especialização.

A Gestão de Dados, passo prévio à Analítica de Dados, é um processo que consta de três elementos: Aquisição e armazenamento, limpeza e depuração e a preparação para sua análise. Este processo implica já uma orientação para uma busca concreta, ou, como afirma o consultor Patricio Rodríguez, “a Analítica de Dados se refere à resposta de preguntas e/ou hipóteses formuladas a partir de técnicas de modelagem e análises”[V]

Algumas iniciativas de aplicação e difusão dão uma aparência prática, inclusive social, aos dados massivos. O Banco Mundial lançou em setembro do 2014 a convocação “Desafio de Inovação de Big Data”, que obteve a resposta de 131 propostas; 14 delas receberam fundos.[VI]

Entre as iniciativas apoiadas houve uma na Índia que conseguiu gerar modelos de predição de pobreza a partir de imagens de satélite noturnas. Mediante fotografias foi analisada a cobertura elétrica em mais de 600,000 aldeias. Este mesmo esquema foi utilizado na Nigéria para medir a relação entre pobreza e baixa eficácia do mercado. Os cientistas combinaram os preços mensais de centos de commodities com tais imagens que revelam os setores que contam com eletricidade.[VII]


O dilema da privacidade

A Internet das Coisas e o Big Data farão com que renunciemos à nossa intimidade? Quanto controle terá a inteligência artificial sobre as nossas vidas? Neste momento já há softwares que realizam ações que os seus criadores não entendem. Por exemplo, em 2016, um algoritmo superou o seu oponente humano no “Go”, um jogo mais intuitivo que o xadrez. O software chamado Alphago aprendeu a jogar por si mesmo a partir somente das regras básicas.[VIII]

Yuval Noah Harari é um historiador israelita que trabalha identificando quais são as perguntas éticas que geram os avanços tecnológicos do século XXI. Uma das suas teses mais inovadoras —e controversas— foi chamada de “a religião dos dados” ou “dataísmo”, um culto no qual imperará a inteligência artificial e a internet das coisas (IoT) vinculados ao Big Data.

“O humanismo diz que, se você tem um problema —indica Harari— você tem que agir conforme a sua livre escolha, ou por escolhas democráticas. No século XXI a autoridade são os algoritmos do Big Data”.[IX] No entanto, para esta nova realidade, o grande dilema é a privacidade dos dados, uma questão ainda não resolvida, mas que está perdendo espaço frente às soluções empíricas. Por exemplo, espera-se que muito em breve os serviços que monitoram os seus usuários com sensores biomédicos 24 horas e que registram o açúcar ou a pressão sanguínea sejam populares.

Com estas ferramentas, as companhias que utilizarem o Big Data e a inteligência artificial poderão tomar melhores decisões sobre a saúde dos humanos. “As pessoas darão a sua intimidade em troca de ter uma saúde melhor. Se você dá a sua intimidade ao Google, não terá que esperar cinco anos para que o médico diga que você tem câncer”, augura Harari. “A intimidade, que era uma ideia central do liberalismo, se tornará uma barreira para o desenvolvimento econômico e tecnológico”.

No começo se apresentava que os benefícios da era digital atingiriam somente os setores da população que pudessem adquirir certos serviços, gerando análises tendenciosas que levariam a decisões parciais. No entanto, com 4,000 milhões de usuários conectados à internet (2018) e um crescimento de 4% no último ano,[X] a brecha tecnológica está reduzindo.

“Acho que a tecnologia tem democratizado coisas que antes eram exclusivas”, indica Gabriel Lázaro, Vice-presidente de Digital da Chubb para a América Latina”.[XI] Para o especialista, será uma decisão individual compartilhar dados pessoais em troca de benefícios, mas isso não representará um maior problema para incrementar o acesso. “Em 15 ou 20 anos todos poderemos ter acesso ao melhor médico, aquele que não podemos pagar atualmente”, afirma.

E o que se prevê será algo que ultrapassará o âmbito do consumo. “Algum algoritmo será capaz de detectar se estamos tristes e colocará a música que escutamos há duas décadas porque conhecerá a nossa vida, poderá manejar as nossas emoções”, comenta Lázaro.

Indica ainda que será difícil ficar de fora devido a que a inteligência artificial poderá reconhecer, a partir de alguns dados atuais e nossos arquivos mais longínquos, como foi o nosso comportamento, não somente físico, mas poderá identificar as nossas emoções e intervir nelas.


Big Data na indústria seguradora

O setor segurador começou a se beneficiar do Big Data mediante ferramentas que permitem identificar padrões, isolar o ruído, criar modelos, testar hipóteses para finalmente integrar o modelo de solução de front-end, que é a parte do software responsável por colher os dados de entrada do usuário.

Um dos elementos que vai lado a lado com o Big Data é o Hadoop, um sistema de código aberto que é utilizado para armazenar, processar e analisar grandes volumes de dados. Google, Yahoo! e Facebook são algumas das empresas que têm utilizado e contribuído para o seu desenvolvimento e, no caso das companhias seguradoras, lhes permitiu superar as barreiras de custo e limite de armazenamento. Desta forma, empresas de gestão de dados têm desenhado estratégias de Big Data que atendem problemas específicos do setor segurador.[XII]

Um destes problemas tem sido manter um suporte tecnológico que traga flexibilidade. Esta qualidade deve permitir combinar dados antigos com dados colhidos em tempo real, o que implica o manejo de diversos formatos e fontes.

O setor segurador deverá estar atento às iniciativas que envolvem o Big Data no setor público, que são uma amostra de ações inclusivas baseadas em ferramentas tecnológicas. Por sua vez, as pessoas que já têm presença no mundo digital sacrificarão gradualmente a sua privacidade, sempre que forem recebendo informação útil, benefícios práticos e melhores serviços das empresas globais. E as seguradoras, estrategicamente, estão um passo adiante.


Bibliografia e fontes

[I] Viktor Mayer-Schönberger, K. C. “Big Data: A Revolution That Will Transform How We Live, Work and Think”, citado por Duarte Vázquez, Octavio. “Desarrollo del curso introductorio: explorando Big Data a través de ejercicios prácticos”. Centro de Investigación en Matemáticas AC. México, 2015. Consultado en https://bit.ly/2rC2Waj.
[II] Diario TI.com. “El volumen de datos total a nivel mundial aumentará en 10 veces para 2025”. 14 de julio 2014. Consultado en https://bit.ly/2BqqhA7.
[III] Collins, W. (2014). Big Data Market Size - 2018. Retrieved October 16, 2014, citado por Duarte Vázquez, Octavio. “Desarrollo del curso introductorio: explorando Big Data a través de ejercicios prácticos”. Centro de Investigación en Matemáticas AC. México, 2015. Consultado en https://bit.ly/2rC2Waj.
[IV] Candiani, Alberto. “Cuánta información podemos procesar”. Página Resistencia Modulada. 30 de junio de 2015. Consultado en https://bit.ly/1P2b0Vl.
[V] Rodríguez, Patricio; Palomino, Norma. El uso de datos masivos y sus técnicas analíticas para el diseño e implementación de políticas públicas en Latinoamérica y el Caribe. Banco Interamericano de Desarrollo, 2017. Consultado en https://bit.ly/2RYXsSB.
[VI] Banco Mundial/Open Knowledge Repository. Report: Big Data Innovation Challenge : Pioneering Approaches to Data-Driven Development. World Bank Group, 2016. Consultado en https://bit.ly/2ExVchX.
[VII] Rodríguez, Patricio, Op. Cit.
[VIII] BBC News. “Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol”. 12 de marzo del 2016. Consultado en https://bbc.in/2EVKJgF
[IX] De Querol, Ricardo. Yuval Noah Harari: “Google elegirá a tu pareja; te conocerá mejor que tú”. El País. 6 de abril del 2017. https://retina.elpais.com/retina/2017/04/05/talento/1491388233_697594.html
[X] Galeano, Susana. “El número de usuarios de Internet en el mundo supera el 50? la población: 4.000 millones (2018)”. Marketing 4 Ecommerce. 1 de febrero de 2018. Consultado en https://bit.ly/2EenhKW
[XI] Entrevista personal con Gabriel Lázaro, VP Digital en Chubb Latinoamérica.
[XII] Power Data. “Nueve estrategias definitivas de Big Data para el sector Seguros”. Consultado en https://bit.ly/2A2boo5.