terça-feira, 18 de fevereiro de 2020

Estratégia e Governança de Dados para Machine Learning

Imagine que estejamos embarcando em uma nova jornada de transformação, e este é o momento do Machine Learning. Frequentamos os principais congressos, ouvimos os maiores especialistas e gurus, analisamos cases e mais cases de sucesso e decidimos: vamos levantar nossas necessidades e verificar como as novas tendências de aprendizado automático podem ser aplicadas para aumentar a competitividade no contexto de nossa empresa.
Digamos também que o primeiro passo tenha sido superado: a necessidade de negócio tenha sido bem definida dentro de todas as variantes oferecidas, seja ela o levantamento de insights sobre o comportamento dos clientes, melhorando a capacidade de ofertar o produto certo para a pessoa certa, uma nova capacidade de análise de fraudes ou a criação de chatbots inteligentes para reduzir custos operacionais e aumentar a satisfação do cliente. Todos os modelos foram criados e os testes realizados com sucesso. Estamos prontos a entrar em produção. Falta só um pequeno detalhe.
Sobre quais dados vamos fazer essas análises? Eles estão no formato, estrutura e quantidade adequados? Existem muitos dados espúrios, duplicados ou inconsistentes? Estamos obtendo e agregando os dados corretos? A abordagem abrange a empresa como um todo?
E, por final: onde estão estes benditos dados?!

Dados são o novo petróleo

É interessante notar como a metáfora acima é aplicável a mais de um sentido desta situação. Da mesma forma que o assim chamado “ouro negro”, apesar de responsável pelo desenvolvimento industrial e humano nos séculos XX e XXI, sem ser refinado e transformado em suas centenas de produtos não é muito mais que um líquido viscoso, escuro e malcheiroso que tem pouca utilidade direta, os dados que circulam dentro da empresa, sem os processos adequados de refino e designação de propósito, não terão muito mais serventia do que entupir terabytes e mais terabytes de sistemas de armazenamento.
Algoritmos de Machine Learning são vorazes consumidores de dados. De uma forma geral, quanto maior sua quantidade, maior seu poder de aprendizado e a acurácia e confiabilidade de seus resultados. Porém, diferentemente da análise de Business Intelligence feita sobre o Big Data convencional, em que dados pouco lapidados e de toda procedência são acumulados e dos quais a informação é extraída pela busca de força bruta e descobrimento de correlações, a abordagem com Machine Learning demanda algo mais sofisticado. Por exemplo, no caso de Análise Preditiva, é desejável que se minimize a redundância de informação entre campos, ou, no caso de Visão Computacional, que imagens para treinamento, validação e testes de um modelo de reconhecimento de padrões tenham a mesma resolução. Isso pede por uma governança que garanta uma visão empresarial unificada dos dados mestres da empresa (clientes, fornecedores, produtos, etc.), eliminação de semânticas sobrepostas, redução de vieses corporativos e completude de informação.

Estratégia e governança

Partindo-se desses princípios, para que uma empresa realmente possa colher os frutos esperados de uma iniciativa empresarial de Machine Learning, é necessário observar as seguintes diretivas estratégicas:
  • Definição precisa do problema ou oportunidade de negócio:
Como em qualquer projeto de transformação empresarial, a falta de uma descrição rigorosa da situação a que se aplica leva quase que certamente a que não se alcancem os resultados desejados, ao desperdício de investimentos e ao descrédito no projeto e na solução proposta. No caso específico de Machine Learning, essa definição deve ser específica e mensurável. Ex.: “estamos implementando uma solução para melhorar nosso relacionamento com o cliente; logo, a proposição principal é a coleta e tratamento de informações sobre seu comportamento com o intuito inicial de prover recomendações de produtos com alto índice de aceitação”. Simples, direto e sem linguajar técnico.
  • Mudança de paradigma estratégico:
A percepção sobre os dados deve mudar. As possibilidades criadas pelo Machine Learning fazem com que deixem de ser algo operacional que tradicionalmente está sob a tutela quase que exclusiva da TI e passem a ser encarados como algo que pertence ao negócio da empresa como um todo. Os dados – e a informação neles encerrada – não devem ser tidos apenas como algo que retrata o que aconteceu, mas como um guia para aquilo que irá acontecer e de como proceder para alcançar os resultados desejados.
  • Levantamento da prontidão dos dados ao uso com Machine Learning:
De acordo com uma pesquisa realizada pela Forbes em 2018 [2], embora 82% dos 700 executivos C-level entrevistados tenham respondido que os dados de pelo menos um de seus departamentos estão prontos para utilização por Machine Learning, apenas 14% destes executivos admitem que tais dados estão disponíveis de forma corporativa abrangente. Com isso, faz-se fundamental um levantamento preciso de onde estão e quais são as principais barreiras a ser endereçadas e quais vantagens já presentes devem ser alavancadas.
  • Gestão estratégica da coleta, classificação, armazenagem e tratamento de dados para utilização com Machine Learning:
Uma estratégia consistente passa pela criação de equipes que pervadam a empresa, ultrapassando barreiras organizacionais, consistindo de líderes de negócio, cientistas de dados e pessoal de Tecnologia da Informação. Essa equipe deve ser responsável pela elaboração de diretrizes para a captação dos dados, seu cruzamento e tratamento iniciais, e pela tomada de decisão sobre como guardar, organizar e acessar essa informação.
Trata-se tanto da aquisição dos dados disponíveis de forma abrangente por toda a companhia, sem a formação de silos, quanto da obtenção em fontes externas como repositórios públicos e parcerias com empresas especializadas e da criação de uma capacidade de geração de dados a partir dos próprios produtos e serviços da empresa. Com isto, estabelece-se a verdadeira vantagem competitiva neste universo: combinar estas fontes para construir um conjunto de dados proprietário e específico para o negócio, difícil de ser replicado pela concorrência.
  • Definição de um roteiro claro para a construção das capacidades:
Outro item comum à maioria dos projetos de transformação de negócios, os elementos de mudança acima descritos devem, de acordo com o nível de prontidão levantado e com as necessidades estratégicas e operacionais indicadas, ser postos em movimento por um time composto pelos stakeholders designados e por especialistas em projetos de transformação. Um roteiro de programa apurado porém flexível deve ser definido e então dividido entre as diversas iniciativas correlacionadas.
  • Envolvimento da alta gestão na execução e monitoria:
O patrocínio executivo, cuja relevância é fator essencial em projetos de transformação, não obstante acaba muitas vezes não sendo exercido com a importância devida pela percepção de que, sendo um trabalho aparentemente de apoio à estratégia, não estaria “à altura dos altos executivos”, ou que seria um “desperdício de seu tempo”. Embora a manutenção atualizada de indicadores de desempenho dos projetos de Machine Learning seja de enorme valia para angariar o apoio do C-level e uma prática altamente recomendável, ainda assim é necessário que estes executivos percebam a necessidade de seu suporte desde o início do programa. O estabelecimento de uma prática de Gestão de Adoção de Mudanças pode ser determinante para o sucesso da empreitada [3].

Um framework para o estabelecimento da prática de Machine Learning

Apoio para o sucesso

Muitas as vezes empresas possuem todo o potencial para alavancar sua produção (passiva e/ou ativa) de dados para criar maior competitividade com Machine Learning, mas esbarram no desconhecimento – ou conhecimento incompleto – sobre o tema, e desistem de aplicar as medidas necessárias.
Por exemplo, muitas vezes o executivo tem um conhecimento profundo sobre seu negócio, e tem uma noção correta de uma prática de análise que o ajudaria a melhorar sua lucratividade – como a necessidade de conhecer melhor o nível de desistência ou migração de seus clientes, ou de criar maneiras de evitar fraudes – mas desconhece quais ferramentas estão disponíveis, qual o orçamento envolvido ou qual o esforço organizacional necessário.
Igualmente, nem sempre uma abordagem em Big Bang é a melhor alternativa para projetos deste tipo. Criar um escopo bem circunscrito, células de trabalho restritas com pessoas das áreas mais diretamente envolvidas e um laboratório para gerar inovação, iteração e disseminação pela empresa pode ser a chave para o sucesso da abordagem de Machine Learning.
Verifica-se, pois, que o tópico é bastante extenso e que as exigências variam grandemente com o negócio e o cenário de cada empresa. A AFM Estratégia de TI para Negócios tem trabalhado o tema Transformação e Inovação Digital voltada ao Machine Learning de forma profunda com o objetivo de ajudar empresas a encontrar o contexto correto e a construir e gerenciar as capacidades necessárias ao melhor aproveitamento desta oportunidade.

Referências

[2]: Forbes Insights Team with Dell Technologies – Behind Every AI Strategy Is A Data Strategy, em Forbes: https://www.forbes.com/sites/insights-delltechnologies/2018/12/04/behind-every-ai-strategy-is-a-data-strategy
[3]: Alessandro Martins – Gestão de Adoção de Mudanças: sua importância em um mercado em constante evolução (Parte I), em AFM Estratégia de TI para Negócios (Blog): https://afmestrategia.blogspot.com/2019/08/gestao-de-adocao-de-mudancas-sua.html