Material de Estudo de Ciência de Dados

Tatiana Escovedo
7 min readJun 29, 2020

--

Nos últimos tempos, tenho recebido muitos pedidos de indicações de livros, cursos e materiais em geral para estudo de Ciência de Dados, tanto de curiosos e iniciantes na área quanto de profissionais já mais experientes. Comecei então a compilar uma lista de indicações de materiais (alguns que conheço com detalhes e outros recomendados por pessoas que os conhecem).

Imagem de Jan Vašek por Pixabay

Cada pessoa tem um estilo preferido de aprendizagem: alguns preferem conteúdos detalhados e profundos, recheados de demonstrações matemáticas; outros preferem ter primeiro uma visão geral dos assuntos e ir se aprofundando de acordo com a necessidade em determinados tópicos (o que particularmente funciona muito bem pra mim e eu chamo de “aprendizado cebola”, pois é feito “em camadas”). Algumas pessoas preferem aprender lendo livros e textos, outras aprendem melhor com vídeos, já outras praticando (colocando a mão na massa); algumas dominam e conseguem estudar bem materiais em inglês ou em outro idioma, enquanto outras rendem melhor em português, sem falar na diversidade de conhecimentos prévios, disponibilidade de tempo e dinheiro para investir nos estudos e o mais importante: o objetivo de cada um no aprendizado de ciência de dados. Para tal, esta lista contém materiais de diversas naturezas, níveis e tópicos relacionados à ciência de dados.

Sintam-se à vontade para deixar recomendações de novos conteúdos e feedbacks das suas experiências com os materiais desta lista. A ideia é termos um material em constante construção! Espero ajudar a todos com esta caminhada que tem início, mas nunca chega ao fim, pois o aprendizado é constante!

Livros

Ciência de Dados, Machine Learning, Inteligência Artificial (geral)

  • Introdução a Data Science: Algoritmos de Machine Learning e métodos de análise — Tatiana Escovedo e Adriano Koshiyama (https://www.casadocodigo.com.br/products/livro-data-science)
  • Livros do Machine Learning Mastery — Jason Brownlee: https://machinelearningmastery.com/products/
  • The Hundred Page Machine Learning Book — Andriy Burkov: http://themlbook.com/
  • Introduction to Data Science: A Python Approach to Concepts, Techniques and Applications — Laura Igual and Santi Seguí
  • Python para análise de dados: Tratamento de dados com Pandas, NumPy e Ipython — Wes McKinney
  • Practical Data Science with R — Nina Zumel and John Mount
  • Data Mining: Conceitos, Técnicas, Algoritmos, Orientações e Aplicações — Ronaldo Goldschmidt, Emmanuel Passos e Eduardo Bezerra
  • Data Science Para Negócios. O que Você Precisa Saber Sobre Mineração de Dados e Pensamento Analítico de Dados — Foster Provost e Tom Fawcett
  • Data Mining: Practical Machine Learning Tools and Techniques — Ian H. Witten, Eibe Frank, Mark A. Hall
  • Data Science do Zero. Primeiras Regras com o Python — Joel Grus
  • R for Data Science: Import, Tidy, Transform, Visualize, and Model Data — Garrett Grolemund and Hadley Wickham
  • Applied Artificial intelligence — Mariya Yao, Adelyn Zhou, Marlene Jia
  • Machine Learning: a Probabilistic Perspective — Kevin Patrick Murphy
  • Pattern Recognition and Machine Learning — Christopher M. Bishop
  • Python Data Science Handbook: Essential Tools for Working with Data — Jake VanderPlas
  • An Introduction to Statistical Learning with Aplications in R — Gareth James, Daniela Witten, Trevor Hastie e Robert Tibshirani — http://faculty.marshall.usc.edu/gareth-james/ISL/
  • Introdução à Ciência de Dados — Fundamentos e Aplicações — Versão parcial preliminar — Pedro A. Morettin e Julio M. Singer — https://www.ime.usp.br/~pam/cdados.pdf
  • Best Machine Learning Books (2020) — https://blog.floydhub.com/best-machine-learning-books/

Deep Learning, Processamento de Linguagem Natural e Text Mining

  • Deep Learning Book: http://www.deeplearningbook.org/
  • Neural Networks and Deep Learning: http://neuralnetworksanddeeplearning.com/
  • Deep Learning — Ian Goodfellow, Yoshua Bengio, Aaron Courville
  • Text Mining with R: A Tidy Approach — David Robinson and Julia Silge
  • Natural Language Processing with Python — Steven Bird, Ewan Klein, Edward Loper
  • Text Mining with R: A Tidy Approach — Julia Silge, David Robinson

Big Data

  • Hadoop: The Definitive Guide — Tom White
  • Spark: The Definitive Guide — Bill Chambers, Matei Zaharia

Análise de Séries Temporais

  • Análise de Séries Temporais — Pedro A. Morettin, Clélia M. C. Toloi

Banco de Dados

  • Projeto de Banco de Dados e Teoria Relacional — C. J. Date
  • Sistemas de Banco de Dados — Ramez Elmasri, Shamkant B. Navathe
  • NoSQL Essencial — Pramod J. Sadalage, Martin Fowler

Algoritmos

  • Estruturas de Dados e Seus Algoritmos — Lilian Markenzon, Jayme Luiz Szwarcfiter

Conceitos matemáticos para Ciência de Dados

  • Practical Statistics for Data Scientists — Andrew Bruce and Peter C. Bruce
  • Statistical Analysis: An Interdisciplinary Introduction to Univariate & Multivariate Methods — Sam K. Kachigan
  • Probability, Random Variables and Stochastic Processes — Athanasios Papoulis, S. Unnikrishna Pillai.
  • Applied Statistics and Probability for Engineers — Douglas C. Montgomery, George C. Runger
  • Introdução à Estatística — M. F. Triola.
  • O Cálculo Com Geometria Analítica — Volume 1 — Louis Leithold
  • Cálculo a Uma Variável — Volumes 1 e 2 — Iaci Malta, Sinésio Pesco, Hélio Lopes.
  • Álgebra Linear — Uma Introdução Moderna — David Poole
  • Álgebra linear e suas aplicações — Gilbert Strang

Sites, Blogs e Artigos Técnicos

Canais e Vídeos

Cursos

Ciência de Dados, Machine Learning, Inteligência Artificial (geral)

Deep Learning, Processamento de Linguagem Natural e Text Mining

Python

R

Power BI

--

--

Tatiana Escovedo

Coordinator at Petrobras / Lato Sensu Teacher and Coordinator at PUC-Rio / Data Scientist / Speaker / Writer