Explorar o universo gera um conjunto enorme de dados. E quando estamos falando sobre os dados que nos deparamos o tempo todo, estamos falando com um conjunto de satélites que estão processando e enviando dados dia e noite durante todo o dia.
As tecnologias de troca de dados assim como as suas fontes são cada vez maiores e diversas, a troca de informações por lasers está quase acontecendo, e como podemos olhar estes dados de perto? Quais mistérios existem neles? Precisamos processá-los rapidamente para entendermos oque estamos observando mas não entendemos.
Assim como _dark matter, _Rob Witoff propõe que as informações que colhemos é na verdade dark data, até que possamos extrair ao máximo todas as informações escondidas ou ocultas ao meio de tantos dados.
A NASA trabalha a um longo tempo extraindo/capturando dados e transformando-os em poder na mão dos especialista para que possamos tomar decisões mais rápido.
Segundo a Harvard Business Review Data Scientist, é o trabalho mais sexy do século 21. O papel do *Data Scientist *é primeiro facilitar a liberação dos dados, e proporcionar o compartilhamento para que por meio da colaboração se crie um conjunto inimaginável de força em volta de um conjunto de dados que nos permita processar e extrair o sentido da nossa dark data.
Hoje é muito mais simples trabalharmos grandes massas de dados do que já foi um tempo atrás, temos muitos serviços sobre demanda, temos uma forte integração entre profissionais e amadores (Pro-Am), que podem impulsionar a descoberta de informação. Então a busca pelo compartilhamento é muito necessária.
Em seguida o Data Scientist deve ser guiado pela idéia de impulsionar/facilitar os especialistas a descoberta e tomada de decisão sobre dados reais. Primeiro fazendo perguntas aos especialista, trabalhando os dados e trazendo-os novamente, para que eles possam olhar, ver, pesquisar e falhar o quanto antes, iterando sobre massas e mais massas de dados.
Existem hoje um conjunto de ferramentas simples que facilitam, a extração de informações dentro de nossa dark data, e assim que a temos, podemos plotá-las e deixá-las mais simples para que possam ser manipuladas e acompanhadas por especialista a todo momento.
Em seguida o Data Scientist deve infundir todo o conhecimento, para que outras pessoas possam descobrir e analisar as informações, manipulando-as da melhor forma possível.
O Data Scientist deve levar o conhecimento para o maior número de informações, para que elas possam transformá-la. Dentro da NASA eles tem alguns programas que possibilitam cientistas, startups entre outros imergirem em dados e informações e no final compartilhá-las com especialista que irão validá-las e enfim gerar mais conhecimento para o público.
Mostrar as informações de uma forma diferente, está gerando um valor cada vez maior sobre as descobertas feitas pela NASA, por que não podemos liberar os dados de nossas empresas, empoderar a comunidade e os especialistas com não só dados mas também informações e ajudar a comunidade a transformá-la, assim terminou a apresentação do Rob Witoff.
http://qconsp.com/keynote/building-data-science-program-nasajpl-visual-analytics