Na quarta-feira, dia 29 de Março de 2017, participei de um evento sobre Big Data, promovido pela Oracle na cidade de Vancouver no Canada, onde eu moro. Além dos Cientistas de Dados da Oracle, participaram do evento representantes de grandes empresas da Costa Oeste do Canada, das províncias de British Columbia e Alberta, além de parceiros da Oracle. Vou compartilhar neste post, alguns dos preciosos insights do evento, além de algumas fotos (as quais tive permissão da Oracle para divulgação aqui no blog).
O evento durou o dia inteiro e começou com aquele discurso tradicional e que não é novidade para quem já conhece o mínimo sobre Big Data: dados são o novo petróleo, nunca geramos tantos dados quanto atualmente, a humanidade gerou mais dados nos últimos 2 anos do que em toda a história, geramos 2,5 quintilhões de bytes por dia, etc, etc, etc…..até aqui nenhuma novidade. A palestra de abertura foi realizada por um dos executivos da Oracle, que claramente compreendia esses conceitos e sua importância para uma organização data-driven.
Na sequência, foi apresentado um case de uma das empresas presentes no evento, a ICBC, companhia de seguros de automóveis no Canada. Por aqui o seguro é obrigatório e a ICBC é a responsável por isso. O case descrevia a utilização de Big Data, para a prevenção de fraudes em seguros, através de análise preditiva com Machine Learning. Vários representantes da ICBC estavam presentes no evento e foi uma ótima troca de experiências de aplicações práticas de Machine Learning e Big Data.
A segunda palestra abordou a gestão estratégica de dados e todas as oportunidades e desafios envolvidos neste tema. As principais plataformas de Big Data e Data Science, como Apache Spark e Apache Hadoop e linguagens Python, R e Scala foram apresentadas como soluções robustas para o processo de Big Data Analytics. Alguns números bem interessantes também foram apresentados, tais como o tamanho do mercado de Big Data no Canada, estimado em 1,5 bilhão de dólares e empresas que aumentam seus lucros em até 125% com a aplicação do Customer Analytics (Data Science aplicada aos dados de clientes). Considerando que apenas 10% das empresas canadenses possuem estratégias de Big Data, esse é um mercado em franca expansão.
Esta segunda palestra também abordou a importância da visualização de dados no processo de coleta e análise de Big Data, além da criação de Data Lake (leia aqui o artigo sobre Data Lake que escrevi quase 1 ano atrás, aqui mesmo no blog). Por fim, foi apresentada a estratégia da Oracle para gestão de dados, como uma plataforma unificada incluindo conceitos como Data Lab e Data Factory.
A terceira palestra foi uma Demo de análise de dados em tempo real (Real Time Analytics), realizada por um dos parceiros da Oracle, a qual não fomos autorizados a fotografar, pois continha dados sensíveis de um cliente da empresa. Basicamente os dados foram coletados com Apache Kafka, processados, analisados e então visualizados em dashboards Real-Time.
Após a parada para o almoço, retornamos com a quarta palestra sobre Integração de Dados, já que quando falamos sobre Big Data, estamos falando de grandes conjuntos de dados, de diferentes fontes e formatos. A principal ferramenta de integração da Oracle continua sendo o ODI (Oracle Data Integration), mas agora com uma pequena diferença. É possível integrar dados entre diversos bancos de dados relacionais e frameworks de Big Data, como Hadoop e Spark. A Oracle está apostando nas soluções open-source de Big Data.
Mas o melhor ficou mesmo por último. A quinta e última palestra sobre a função da Inteligência Artificial e do Machine Learning. A palestra foi conduzida pelo Cientista de Dados Chefe da divisão de plataformas de Big Data da Oracle e que trabalhava na Amazon, na equipe que criou o Amazon Go, a loja da Amazon em Seattle e que não possui caixas no atendimento. Você instala uma app no seu celular, entra na loja, pega os produtos e sai. O pagamento é debitado do seu cartão de crédito. A paixão do palestrante sobre o tema era contagiante, de quem claramente já entendeu que Inteligência Artificial está transformando o mundo. Ele falou sobre Deep Learning, GPUs Nvidia, o modelo de prevenção de fraudes do Paypal, totalmente baseado em Inteligência Artificial e terminou a palestra com a seguinte mensagem para as empresas:
Encontrem Cientistas de Dados e usem soluções open-source
O evento mostrou aquilo que vemos no dia a dia. Cada vez mais empresas percebem a importância da análise de grandes conjuntos de dados e aplicação de Data Science para detectar padrões e fazer previsões. Inteligência Artificial é uma evolução natural desse processo e a palestra sobre este tema gerou uma inundação de perguntas dos profissionais presentes, que levaram de volta para suas empresas a mensagem de que mudanças estão a caminho.
Todos os participantes do evento receberão os slides das 5 palestras e já recebi autorização dos organizadores do evento para compartilhar os slides. Vou compartilhá-los com os alunos da Formação Cientista de Dados, da Data Science Academy! Definitivamente, o único programa do Brasil, alinhado com o que há de mais avançado em Big Data, Data Science e Inteligência Artificial!
David Matos
David, ótimo vc ter participado do evento, talvez posso receber o material de data integration do Oracle,
grata pela atenção,
shermila.
Oi Shermila. Obrigado. Sim, tão logo eu receba, vou compartilhar com os alunos da Data Science Academy. Abs
Olá, David. Obrigado por compartilhar a experiência conosco. Ainda sou iniciante na área, mas fiquei com uma dúvida em relação a afirmação de que a data science academy seria o único programa alinhado com o que tem de mais avançado em Big Data, Data Science e IA no Brasil. A FIAP possui um MBA em Data Science e Big Data, onde verificando a ementa do curso notei que aborda boa parte das disciplinas que foram listadas aqui no blog entre outros sites que abordam o tema aqui no Brasil. Saberia dizer se tecnicamente podemos considerar um programa com forte conteúdo para a formação de um cientista de dados ?
Olá Felipe. Obrigado pelo feedback. Sim, existem alguns programas pelo Brasil e creio que este da FIAP seja muito bom. Mas o que tenho visto é uma série de cursos de MBA e Pós que focam bastante na teoria, mas pouco na prática, exatamente por se tratar de uma área nova no Brasil e com poucos profissionais realmente habilitados e com experiência. Boa parte dos instrutores da Data Science Academy são brasileiros, mas moram fora do Brasil, onde as áreas de Big Data, Data Science e IA estão muito mais maduras e tem levado esta experiência para os alunos, que aliás, adoram o curso. Dentre os alunos da Formação Cientista de Dados, tem vários que fizeram ou ainda fazem MBA na FIAP e em outras instituições com cursos similares, mas precisavam de conhecimento mais prático, que pudesse ser imediatamente aplicado no ambiente de trabalho ou em projetos de clientes. Abs
Perfeito, David. Obrigado mais uma vez pelo esclarecimento!