Em um mundo em que temos acesso tão fácil a uma enorme quantidade de dados, como é possível nos sentirmos tão perdidos em relação ao que é tido como conhecimento confiável? Como a sociedade chegou a um ponto de duvidar de toda verdade em uma realidade repleta de fatos? Para tentar responder a essas - e algumas outras - perguntas, levando em consideração o impacto dos dados para a produção científica, a pesquisadora italiana Sabina Leonelli escreveu o livro A Pesquisa Científica na Era do Big Data: cinco maneiras que mostram como o Big Data prejudica a ciência, e como podemos salvá-la (traduzido de La Ricerca Scientifica nell’Era dei Big Data. Cinque modi in cui i Big Data danneggiano la scienza, e come salvarla).
A versão em português da obra será lançada pela Editora Fiocruz em uma data especial para a ciência brasileira: 25 de maio, aniversário da Fiocruz. O título estará disponível para aquisição nos formatos impresso – via Livraria Virtual da Editora – e digital, por meio da plataforma SciELO Livros. A tradução é de Carla Cristina Munhoz Xavier e a revisão técnica foi conduzida por Bethânia Almeida e Mauricio Barreto, pesquisadores do Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs), vinculado à Fiocruz Bahia.
O livro reúne ideias e lições extraídas dos muitos anos de estudos e pesquisas da autora, refletindo sobre como cientistas podem utilizar os chamados Big Data para realmente atender às necessidades da sociedade. Mas como é possível, afinal, caracterizar a expressão Big Data? É o que a pesquisadora busca fazer no primeiro capítulo, mostrando que, ao contrário do que o senso comum costuma levar em consideração, o termo não se refere apenas a quantidade. Há uma série de outros aspectos relacionados aos dados.
Leonelli menciona, inclusive, uma série de características que têm sido associadas ao Big Data nos últimos anos, os chamados sete "Vs": volatilidade; variedade; volume; validade; veracidade; valor; velocidade. "O Big Data, portanto, não são apenas 'muitos dados'. O que realmente o caracteriza são as várias formas como é produzido e circula entre os diferentes setores sociais. Esse é o poder e a verdadeira promessa do Big Data: permitir o estabelecimento de conexões entre setores e abordagens que, no passado, se mostraram difíceis, tanto por barreiras sociais quanto por razões técnicas, de dialogar diretamente. Em vez de tentar definir o que é Big Data em termos de características físicas e de quantidade, proponho, portanto, caracterizá-lo em função da forma como é usado. (...) são dados de diferentes tipos e origens que se relacionam, muitas vezes em formato digital e de formas que se prestam ao aprendizado de máquina, de modo a produzir novos procedimentos de análise e conhecimento", afirma.
O livro gira em torno das análises dos usos desse grande volume de dados na ciência contemporânea, com ênfase em seus dilemas, desafios e potencialidades. "Nesses muitos anos de estudo, encontrei muitos problemas na transformação de dados em conhecimento. Muitas vezes vi vieses nos dados. Também vi problemas nas infraestruturas que são utilizadas para divulgar os dados e disponibilizá-los aos pesquisadores, como em bancos de dados, por exemplo. Mas também vi maneiras pelas quais alguns desses problemas podem ser resolvidos. O que é muito importante é que tanto cientistas quanto membros da sociedade que usam os resultados da ciência e da tecnologia estejam cientes de algumas dessas questões, e que estejam preparados para enfrentá-las", propõe a pesquisadora.
Bethânia Almeida e Mauricio Barreto enfatizam que a autora argumenta que "dados devem ser concebidos de forma relacional porque podem ser usados para representar diferentes aspectos da realidade cujas interpretações dependem da origem, condições de organização, processamento, análise e das situações em que são utilizados". Ambos os pesquisadores destacam, no prefácio do título, que o interesse pelas publicações de Leonelli foi imediato, uma vez que o trabalho da professora italiana encontra forte ressonância nas pesquisas desenvolvidas no Cidacs, criado em 2016 com o objetivo de produzir conhecimento e gerar evidências relacionadas à saúde da população brasileira exatamente a partir de grande volume de dados.
Ciência x Big Data
Os riscos que os dados impõem à integridade científica são reais, especialmente quando altamente vinculados a interesses comerciais. "Um fator comum e crucial para a compreensão do papel dos dados na sociedade contemporânea é o reconhecimento de que todos os tipos de dados (sejam ou não produzidos e usados por pesquisadores; sejam ou não reconhecidos como fontes legítimas de conhecimento) têm potencial valor comercial, especialmente quando são agregados para análises e previsões sobre o comportamento das massas. Basta dar uma olhada na lista dos setores mais rápidos e bem-sucedidos em todo o país e no mundo para perceber que as empresas e startups de análise de dados cresceram exponencialmente na última década e que os seus serviços são, agora, aceitos como uma parte indispensável de qualquer setor, desde a organização de uma campanha eleitoral até o lançamento de um novo produto. Coletar, mobilizar e analisar dados não é uma ocupação restrita ao mundo da pesquisa, mas, sim, uma expressão fundamental do desenvolvimento econômico capitalista, que caracteriza o livre mercado global", alerta Sabina.
Ao apontar os problemas do uso acrítico do Big Data, a autora observa que cientistas devem estar atentos à preservação dos princípios éticos, utilizando os dados de forma a atender às demandas da sociedade e promovendo a integridade em pesquisa. "Uma das mensagens importantes que Leonelli nos transmite é a necessidade de reconhecimento de que o Big Data não é estático. Ao contrário, dados se transformam e se movem, seja pela realização de múltiplos procedimentos que visam a seu enriquecimento, seja pelo seu compartilhamento. Conhecer o ciclo de vida de um conjunto de dados, sua qualidade e o contexto em que é usado é essencial para avaliar sua adequação para a pergunta de pesquisa e interpretação dos resultados", pontua Claudia Medina Coeli, professora do Instituto de Estudos de Saúde Coletiva da Universidade Federal do Rio de Janeiro (Iesc/UFRJ), na orelha da obra.
As críticas e desconfianças ao uso excessivo e incontrolado de dados - e suas amplas implicações comerciais - são questões que norteiam o importante subtítulo do volume (cinco maneiras que mostram como o Big Data prejudica a ciência, e como podemos salvá-la). Mas é diante desses dilemas que Leonelli busca, a partir de sua ampla pesquisa, mostrar as potencialidades dos dados e as maneiras como a ciência pode agir em meio a um cenário hostil. "Em tempos difíceis, a autora mostra que uma comunidade científica bem-informada e consciente dos desafios pode afrontar estes tempos distópicos", afirma o físico Olival Freire Junior (professor titular da Universidade Federal da Bahia), no texto de quarta capa.
Passados mais de dois anos do início da pandemia de Covid-19, nunca se falou tanto dos desafios da produção científica em todo o mundo. Em meio aos dilemas e contradições dos tempos de pós-verdade e desinformação, o livro é lançado em uma data comemorativa para a ciência nacional: o aniversário de 122 anos da Fiocruz, celebrado em 25 de maio. No mesmo mês em que a Editora Fiocruz completa 29 anos de existência, focada na difusão do acesso às pesquisas nas mais diversas áreas de saúde pública e saúde coletiva. O título escrito por Sabina Leonelli vem se somar a essa missão, buscando estimular novas formas de produção do conhecimento científico. "Esta obra, escrita em linguagem direta, compreensível e de fácil e agradável leitura, porém sem perder a profundidade e o rigor exigidos pelo tema abordado, constitui-se em excelente oportunidade para o leitor refletir sobre as transformações em curso relacionadas à produção, disponibilização, análise e reutilização de dados oriundos de distintas fontes e suas possíveis consequências na geração de conhecimento na era da pós-verdade", resumem Bethânia Almeida e Mauricio Barreto.
Autora
Doutora em Filosofia da Ciência, Sabina Leonelli é professora titular de Filosofia e História da Ciência na Universidade de Exeter (Reino Unido). É codiretora do Centro Exeter para o Estudo das Ciências da Vida (Egenis) e líder de temas voltados para a governança de dados, algoritmos e valores no Instituto de Ciência de Dados e Inteligência Artificial da mesma universidade.
Tradutora e Revisores Técnicos
Graduada em Letras - Inglês pela Pontifícia Universidade Católica de São Paulo (PUC-SP), a tradutora Carla Cristina Munhoz Xavier é doutora em Linguística pela Universidade de Sheffield, na Inglaterra.
Graduada em Ciências Sociais, Bethânia Almeida, revisora técnica do livro, é doutora em Saúde Coletiva pela Universidade Federal da Bahia (UFBA). É servidora da Fiocruz e pesquisadora do Cidacs da Fiocruz Bahia.
Graduado em Medicina e Ph.D. em Epidemiologia pela Universidade de Londres (Inglaterra), Mauricio Barreto, também revisor técnico, é coordenador do Cidacs da Fiocruz Bahia e professor emérito da UFBA.
Serviço:
A Pesquisa Científica na Era do Big Data: cinco maneiras que mostram como o Big Data prejudica a ciência, e como podemos salvá-la
Editora Fiocruz
Primeira edição: 2022
Tradução de La Ricerca Scientifica nell’Era dei Big Data. Cinque modi in cui i Big Data danneggiano la scienza, e come salvarla
149 páginas
Preço de capa (versão impressa): R$ 54,00
Preço e-book (versão digital): R$ 32,40