Tecnologia por Cezar Taurion

Big Data. Ou melhor, Big Challenge

Publicada em 14/11/2012 16:04

Neste ano um dos assuntos mais falados foi Big Data. Uma pesquisa no Google Trends mostra um crescimento exponencial no interesse sobre o tema. Participei também de diversas palestras e reuniões com executivos para debater o assunto, e concluí que ainda estamos discutindo muito e fazendo relativamente pouco.

Claro que existem diversos casos de sucesso, mas a maioria das empresas ainda não tem uma visão clara do que é Big Data, do seu potencial e de como alavancar esta potencialidade. O próprio conceito de Big Data ainda está um pouco nebuloso. Veja, por exemplo, o que diz o Global Language Monitor em relação ao assunto: Big Data e Cloud estão entre os conceitos de tecnologia mais confusos da década – todo mundo usa, mas sequer sabe o que significa.

O que vejo são muitas empresas entrando em iniciativas de Big Data sem uma estratégia bem definida, que as oriente. Big Data não é apenas comprar pacotes de tecnologia, mas uma nova maneira de explorar o imenso volume de dados que circula dentro e fora das empresas. Big Data embute transformações em processos de negócio, fontes de dados, infraestrutura de tecnologia, capacitações e, até mesmo, mudanças organizacionais na empresa e em TI.

Antes de tudo, é importante lembrar que Big Data não trata apenas da dimensão e do volume, mas existe também uma variedade imensa de dados não estruturados, coletados das mídias sociais, por exemplo, que precisam ser validados (ou seja, terem veracidade para serem usados) e tratados em velocidade adequada para gerarem valor para o negócio. A fórmula é, então: Big Data = volume + variedade + velocidade + veracidade +  valor.

A questão do valor é importante. Big Data só faz sentido se o valor da análise dos dados compensar o custo de sua coleta, armazenamento e processamento. Existem também questões legais a serem resolvidas. Conheço um caso muito curioso de uma grande rede varejista americana que usa um sofisticado algoritmo de análise preditiva, baseado na varredura de um imenso volume de dados de seus clientes.

O algoritmo chegou à conclusão que determinado padrão de compras e comentários nas mídias sociais levantava uma boa possibilidade de uma determinada pessoa estar grávida, e enviou correspondência com promoções para grávidas para sua residência. Quem abriu foi o pai da adolescente, que descobriu então a gravidez a filha. O advertising baseado nestas análises é uma questão ainda indefinida de invasão de privacidade. O uso de dados para prever eventos futuros da vida de uma pessoa tem consequências impactantes, particulamente se familiares ou potenciais empregadores passam a ter conhecimento de questões pessoais ligadas a estilo de vida ou estado clínico. Pior se a análise não for verídica, o que geraria um inconveniente muito grande e, eventualmente, um processo legal.

A capacitação profissional é um fator importantíssimo. Recomendo a leitura do texto “7 new types of jobs created by Big Data”, que mostra que existem várias possibilidades de capacitação no setor, tanto no viés técnico como no analítico.

No lado analítico, é necessário preparação para sair do questionamento atual, que se faz pelo tradicional BI (“qual foi nossa taxa de crescimento em vendas mês a mês, nos últimos dois anos”), obtida pelos dados históricos armazenados no Data Warehouse e coletados pelos sistemas transacionais para novos tipos de análises. Com dados coletados em tempo real (não apenas pelos sistemas transacionais, mas também de midias sociais, bases de dados públicas, entre outras fontes, inclusive as que estão em sistemas internos), mas inaproveitados, podemos, por exemplo, chegar a respostas mais complexas, como, por exemplo: “como podemos crescer 20% no ticket médio de nossos clientes nas lojas da Zona Sul do Rio de Janeiro, ao mesmo tempo em que a concorrência está inaugurando duas novas lojas?”.

Analisar o comportamento dos seus clientes e do mercado como um todo pode levar a identificação de oportunidades de lançamento de novos produtos, focados em determinados nichos que não são cobertos pela concorrência.

Big Data é um Big Challenge para os CIOs e a área de TI. Primeiro temos as tecnologias que envolvem Big Data. Muitas vezes será necessário ir além das tecnologias tradicionais de banco de dados e Data Warehouse, entrando no campo dos bancos de dados NoSQL e processamento massivo. Temos também a questão da privacidade e acesso a dados confidenciais. É essencial criar uma politica de acesso e divulgação das informações. Análises preditivas podem gerar resultados capazes de questionar algumas perspectivas de negócios da empresa, sendo necessário ter sua divulgação filtrada para não sofrerem disseminação inadequada. A capacidade analítica para traduzir dados em informações e conhecimento é outro desafio. Requer capacitação e ferramentas de visualização bem mais sofisticadas. Outra mudança que Big Data embute é a transformação das relações entre TI e o negócio. TI deve prover a base tecnológica, governança e procedimentos de segurança para o Big Data, mas as consultas e análises deverão ser feitas pelas áreas de negócio. O modelo Big Data deve ser para o usuário um modelo

Big Data não é, em absoluto, um hype de mercado. É um tsunami ainda em alto mar, pouco visível, mas com poder de causar devastação imensa se for ignorado. A minha sugestão é avaliar o impacto do Big Data na sua indústria e na sua empresa, considerando quão distante a sua organização está hoje em termos de “estar preparada” para o que vem pela frente. Isto significa avaliar a empresa e a área de TI para as tecnologias, capacitações e processos que serão necessários para explorar o potencial do Big Data. Adicionalmente, ainda é um cenário imaturo e existem poucos exemplos de “melhores práticas”. Portanto, é uma iniciativa inovadora para a maioria das empresas, com os riscos e as recompensas dos empreendedores inovadores.  Mas ficar parado esperando a onda chegar será perigoso, pois, provavelmente até o fim da década, Big Data passará a ser apenas “Just Data”. Será o modelo natural de pensar análises de dados.

Leitura recomendada:

ManyEyes – http://www-958.ibm.com/software/data/cognos/manyeyes/

  • Pingback: cdeccache | Pearltrees

  • Gilberto Strapazon

    Big Data: aquela quantidade enorme de informações que uma
    boa parte das pessoas ainda acham que é só jogar dentro do computador e
    depois… “a gente puxa o que precisa”. Citando algo que ouvi de um gerente de
    uma distribuidora nem faz muito. 

    As informações estão lá mas o que falta? Acho interessantes
    certos algoritmos e metodologias. Falando de um exemplo popular, quem é que não
    se espanta (ou fica furioso direto) com a insistência do Google achar que só
    temos interesse numa estreita faixa de assuntos. Sério, cada vez que preciso
    uma pesquisa um pouco maior, eu apago todos cookies, não uso meu login e fico
    resetando a porcaria o tempo todo. Se eu definir nas configurações de pesquisa
    que prefiro usar inglês e quero resultados em todas línguas e países porque
    aparece logo de cara um monte de coisa local ou muito próxima? E muitas vezes,
    só consigo o que preciso entrando na versão do site de outros paíse, .uk, .jp,
    .cc, .qualquer coisa.

    Não muito diferente do Big Data, esta mesma intrusão da
    minha vontade (que alguém chama de inteligência computacional) traz resultados
    que são limitados (note bem) a “visão do mundo” que seus desenvolvedores tem. E
    quem são os desenvolvedores? Olhem os anúncios de empregos que logo saberão
    porque tem tanta coisa mal feita por aí, dando prejuízos gigantescos ao
    mercado.

    Que critérios estas pessoas tem para analisar ou ponderar
    sobre a vida dos outros ou sobre informações tão abrangentes?

    Veja, estou exemplificando muito genericamente com o Google,
    mas na prática não tem muita diferença para o que acontece em grandes sistemas
    de BI e outras coisas.

    Cada vez mais falta consciência ou pelo menos, noção de que
    estão lidando com as informações de pessoas, serem humanos.

    Mesmo empresas precisam ser revistas: são organismos
    sociais. Comportam-se como organismos e podem ser desta forma observadas. Um
    bom médico vai observar a pessoa e saber sobre sua estrutura orgânica. Mas vai
    observar se a pessoa está num momento pessoal que possa provocar mudanças no
    funcionamento do organismo. Entende isto?

    O engraçado exemplo (humor negro) da adolescente que teve
    sua gravidez revelada para os pais devido a uma invasão total de sua
    privacidade nos mostra, de novo, que algum (mau) gerente/diretor cometeu mais
    uma vez, repito, mais uma vez, de novo uma barbaridade histórica: se importar
    só em aproveitar o espaço para empurrar sua propaganda goela abaixo do mercado
    e garantir mais uns pontinhos no seu bonito gráfico feito com alguma ferramenta
    da moda. Cadê a consideração com as pessoas?

    Cadê a consideração com a informação, como pode ser colhida,
    para quê e visando quais resultados? Quantos projetos de engenharia já
    resultaram em fracasso porque alguém juntou informações sem se importar como
    aquilo seria usado noutro momento? O desabamento de um prédio devido a uma
    inundação sazonal que enfraqueceu suas fundações ocorre porque as informações históricas
    sobre o terreno foram negligenciadas ou insuficientemente avaliadas é um
    exemplo.

    Juntem tudo isso aí com as redes sociais. Por mais que
    certos modelos matemáticos até ajudem para algumas coisas, coleta de
    informações e amostragem não funciona muito bem em rede social pois é estéril,
    generalista e sem vida. Rede social é um organismo coletivo. Se não considerar
    “quem” está falando, se perde a importância e a qualidade das
    informações. Uma pessoa comum troca informações aos montes, sem compromisso.
    São muitas mensagens dispersas.

    Mas se for um formador de opinião, um líder de grupo, com
    poucas mensagens, mas de profundidade e conteúdo, estas atingem centenas ou
    milhares de pessoas. É preciso desenvolver consciência e não apenas métricas ou
    propaganda “bonitinha”.

    Lucro se consegue com qualidade e produtividade. Cada vez
    que abordo sobre gestão e consciência no blog, tento mostrar que coisas
    automatizadas e repetitivas, não tem criatividade, geram pouco lucro e,
    portanto estão prestes a serem deixadas para trás.

    Empresas também são organismos e como tal devem ser vistos e
    pensados. Portanto, a Big Data é o mesmo que milhares de livros numa imensa
    biblioteca e que hoje, na maioria, vão ser pesquisados por adolescentes (os
    bots) que estão mais preocupados com o final do expediente para irem namorar ou
    qualquer outra coisa. Os métodos vão ajudar a manter a turma numa certa ordem e
    também para conseguir com que coloquem os dados coletados pelo menos numa pilha
    mais ou menos organizada.

    E esta pilha de dados coletados, vai ser compilada e
    analisada por alguém (sistema) que não tem a menor ideia donde aquilo veio, nem
    vai considerar a importância gigantesca que teria o fato de um determinado
    livro ter sido estrategicamente colocado numa certa área. Perdem-se pistas e
    oportunidade de olhar o conjunto todo.

    Vocês só vão ter isto se subirem num patamar, não muito
    acima da multidão e enxergarem todos, mas ao mesmo tempo, o suficientemente
    próximos para observar as interações pessoais, os relacionamentos entre dados.

    Vale o mesmo numa relação com clientes. Generalizar o
    cliente é o mesmo que não conhecer o mercado. Generalizar a informação é não
    conhecer o que seja informação.

    É comum fazerem reunião interna ou chamar o pessoal da
    propaganda para debater o que “eles acham” que os clientes pensam. Ignora-se
    a fonte. Cuidado para não ouvir apenas o “conveniente”. Tá cheio de
    estatística e pesquisa de mercado fajuta feitas para agradar o contratante. O
    mesmo para tantas análises de dados que desconsideram coisas muito importantes.

    Ombudsman para Big Data? Por que não?

    Ferramentas decentes para trabalhar com tudo isto? Claro que
    sim, mas acessíveis e isto não é, repito, não é para qualquer empresinha metida
    a besta. De nada adianta se meter num projeto destes e já reclamarem da
    economia do palito de fósforos.  Claro
    que ninguém, e falo do pessoal profissional, está na empresa para jogar
    dinheiro fora.

    O pessoal que trabalhar nestas áreas precisa e deve
    participar e ter conhecimento dos processos, ter acesso e uma certa liberdade
    de ação.  

    É mais barato e lucrativo trabalhar direito. E sem ficar
    esperando milagres.

     

     

  • Pingback: Big Data. Ou melhor, Big Challenge « Blog Accertato

  • Pingback: Recent Headlines | The Global Language Monitor

  • Marcelle Xavier

    Excelente artigo sobre Big Data, realmente um assunto muito falado mas pouco se sabe sobre o lado prático do uso de big data para aumentar o valor das empresas. Fizemos um infográfico sobre o uso de big data em e-commerces que talvez ajude a esclarecer alguns pontos: http://www.uaizo.com/infographics/big-data-e-commerce/