Material de Estudo de Ciência de Dados
Nos últimos tempos, tenho recebido muitos pedidos de indicações de livros, cursos e materiais em geral para estudo de Ciência de Dados, tanto de curiosos e iniciantes na área quanto de profissionais já mais experientes. Comecei então a compilar uma lista de indicações de materiais (alguns que conheço com detalhes e outros recomendados por pessoas que os conhecem).
Cada pessoa tem um estilo preferido de aprendizagem: alguns preferem conteúdos detalhados e profundos, recheados de demonstrações matemáticas; outros preferem ter primeiro uma visão geral dos assuntos e ir se aprofundando de acordo com a necessidade em determinados tópicos (o que particularmente funciona muito bem pra mim e eu chamo de “aprendizado cebola”, pois é feito “em camadas”). Algumas pessoas preferem aprender lendo livros e textos, outras aprendem melhor com vídeos, já outras praticando (colocando a mão na massa); algumas dominam e conseguem estudar bem materiais em inglês ou em outro idioma, enquanto outras rendem melhor em português, sem falar na diversidade de conhecimentos prévios, disponibilidade de tempo e dinheiro para investir nos estudos e o mais importante: o objetivo de cada um no aprendizado de ciência de dados. Para tal, esta lista contém materiais de diversas naturezas, níveis e tópicos relacionados à ciência de dados.
Sintam-se à vontade para deixar recomendações de novos conteúdos e feedbacks das suas experiências com os materiais desta lista. A ideia é termos um material em constante construção! Espero ajudar a todos com esta caminhada que tem início, mas nunca chega ao fim, pois o aprendizado é constante!
Livros
Ciência de Dados, Machine Learning, Inteligência Artificial (geral)
- Introdução a Data Science: Algoritmos de Machine Learning e métodos de análise — Tatiana Escovedo e Adriano Koshiyama (https://www.casadocodigo.com.br/products/livro-data-science)
- Livros do Machine Learning Mastery — Jason Brownlee: https://machinelearningmastery.com/products/
- The Hundred Page Machine Learning Book — Andriy Burkov: http://themlbook.com/
- Introduction to Data Science: A Python Approach to Concepts, Techniques and Applications — Laura Igual and Santi Seguí
- Python para análise de dados: Tratamento de dados com Pandas, NumPy e Ipython — Wes McKinney
- Practical Data Science with R — Nina Zumel and John Mount
- Data Mining: Conceitos, Técnicas, Algoritmos, Orientações e Aplicações — Ronaldo Goldschmidt, Emmanuel Passos e Eduardo Bezerra
- Data Science Para Negócios. O que Você Precisa Saber Sobre Mineração de Dados e Pensamento Analítico de Dados — Foster Provost e Tom Fawcett
- Data Mining: Practical Machine Learning Tools and Techniques — Ian H. Witten, Eibe Frank, Mark A. Hall
- Data Science do Zero. Primeiras Regras com o Python — Joel Grus
- R for Data Science: Import, Tidy, Transform, Visualize, and Model Data — Garrett Grolemund and Hadley Wickham
- Applied Artificial intelligence — Mariya Yao, Adelyn Zhou, Marlene Jia
- Machine Learning: a Probabilistic Perspective — Kevin Patrick Murphy
- Pattern Recognition and Machine Learning — Christopher M. Bishop
- Python Data Science Handbook: Essential Tools for Working with Data — Jake VanderPlas
- An Introduction to Statistical Learning with Aplications in R — Gareth James, Daniela Witten, Trevor Hastie e Robert Tibshirani — http://faculty.marshall.usc.edu/gareth-james/ISL/
- Introdução à Ciência de Dados — Fundamentos e Aplicações — Versão parcial preliminar — Pedro A. Morettin e Julio M. Singer — https://www.ime.usp.br/~pam/cdados.pdf
- Best Machine Learning Books (2020) — https://blog.floydhub.com/best-machine-learning-books/
Deep Learning, Processamento de Linguagem Natural e Text Mining
- Deep Learning Book: http://www.deeplearningbook.org/
- Neural Networks and Deep Learning: http://neuralnetworksanddeeplearning.com/
- Deep Learning — Ian Goodfellow, Yoshua Bengio, Aaron Courville
- Text Mining with R: A Tidy Approach — David Robinson and Julia Silge
- Natural Language Processing with Python — Steven Bird, Ewan Klein, Edward Loper
- Text Mining with R: A Tidy Approach — Julia Silge, David Robinson
Big Data
- Hadoop: The Definitive Guide — Tom White
- Spark: The Definitive Guide — Bill Chambers, Matei Zaharia
Análise de Séries Temporais
- Análise de Séries Temporais — Pedro A. Morettin, Clélia M. C. Toloi
Banco de Dados
- Projeto de Banco de Dados e Teoria Relacional — C. J. Date
- Sistemas de Banco de Dados — Ramez Elmasri, Shamkant B. Navathe
- NoSQL Essencial — Pramod J. Sadalage, Martin Fowler
Algoritmos
- Estruturas de Dados e Seus Algoritmos — Lilian Markenzon, Jayme Luiz Szwarcfiter
Conceitos matemáticos para Ciência de Dados
- Practical Statistics for Data Scientists — Andrew Bruce and Peter C. Bruce
- Statistical Analysis: An Interdisciplinary Introduction to Univariate & Multivariate Methods — Sam K. Kachigan
- Probability, Random Variables and Stochastic Processes — Athanasios Papoulis, S. Unnikrishna Pillai.
- Applied Statistics and Probability for Engineers — Douglas C. Montgomery, George C. Runger
- Introdução à Estatística — M. F. Triola.
- O Cálculo Com Geometria Analítica — Volume 1 — Louis Leithold
- Cálculo a Uma Variável — Volumes 1 e 2 — Iaci Malta, Sinésio Pesco, Hélio Lopes.
- Álgebra Linear — Uma Introdução Moderna — David Poole
- Álgebra linear e suas aplicações — Gilbert Strang
Sites, Blogs e Artigos Técnicos
- https://machinelearningmastery.com/
- https://www.kdnuggets.com
- http://datascienceacademy.com.br/blog
- https://towardsdatascience.com/
- http://www.minerandodados.com.br
- Checklist de projetos para Machine Learning: https://medium.com/databootcamp/meu-checklist-de-projetos-de-aprendizado-de-m%C3%A1quina-34328850d7ab
- Cheatsheets for Data Science: https://startupsventurecapital.com/essential-cheat-sheets-for-machine-learning-and-deep-learning-researchers-efb6a8ebd2e5
- Exemplos em Python: https://github.com/donnemartin/data-science-ipython-notebooks
- Capacitação em Data Science — Walison de Souza Abreu: https://www.linkedin.com/pulse/capacita%25C3%25A7%25C3%25A3o-em-data-science-walison-de-souza-abreu/?trackingId=uAgjDBFS5wBWifgEkvMJJQ%3D%3D
- Como começar na carreira de cientista de dados (sem gastar muito) — Robson Cristian: https://www.linkedin.com/pulse/como-come%C3%A7ar-na-carreira-de-cientista-dados-sem-gastar-cristian/
- 5 passos para se tornar cientista de dados — Orlando Silva Junior: https://www.linkedin.com/pulse/5-passos-para-se-tornar-cientista-de-dados-orlando-silva-junior/
- Como começar a aprender Estatística e Ciência de dados — Thiago Marques: https://www.linkedin.com/pulse/como-come%C3%A7ar-aprender-estat%C3%ADstica-e-ci%C3%AAncia-de-dados-thiago-marques
- Sobre BI, Ciência e Engenharia de Dados: Um olhar de perto, um olhar de longe — Carlos Alberto Rocha Cardoso: https://medium.com/dataengineerbr/sobre-bi-ci%C3%AAncia-e-engenharia-de-dados-um-olhar-de-perto-um-olhar-de-longe-cfddd232b741
- “Top 40” R packages: https://www-r--bloggers-com.cdn.ampproject.org/c/s/www.r-bloggers.com/august-2019-top-40-r-packages/amp/
- Wiki-R: https://www.ufrgs.br/wiki-r/index.php?title=Bem-vindo_%C3%A0_Wiki_R
- Por onde começo a minha carreira em ciência de dados? — Cristiane Massena: https://abracd.org/por-onde-comeco-a-minha-carreira-em-ciencia-de-dados-parte-1/?preview=true&_thumbnail_id=1039 e https://abracd.org/por-onde-comeco-a-minha-carreira-em-ciencia-de-dados-parte-2/
- 5 mistakes you can avoid in your first steps as Data Scientist — Roman Rodomanskyy: https://medium.com/predict/5-mistakes-you-can-avoid-in-your-first-steps-as-data-scientist-6fba006c292d
- Um guia completo para o pré-processamento de dados em machine learning (Caíque Coelho): https://medium.com/@caiquecoelho/um-guia-completo-para-o-pr%C3%A9-processamento-de-dados-em-machine-learning-f860fbadabe1
- 12 Things I Learned During My First Year as a Machine Learning Engineer — (Daniel Bourke): https://towardsdatascience.com/12-things-i-learned-during-my-first-year-as-a-machine-learning-engineer-2991573a9195
- My Self-Created Artificial Intelligence Masters Degree (Daniel Bourke): https://towardsdatascience.com/my-self-created-ai-masters-degree-ddc7aae92d0e
- Start Your Machine Learning Career in Quarantine (Ahmad Anis): https://www.kdnuggets.com/2020/05/machine-learning-career-quarantine.html
- How to learn data science on your own: a practical guide (Jeremie Harris): https://towardsdatascience.com/how-to-learn-data-science-on-your-own-a-practical-guide-1a871fec2034
- Top 7 Things I Learned on my Data Science Masters (Dario Radecic): https://towardsdatascience.com/top-7-things-i-learned-on-my-data-science-masters-bd89fdbab769
- The Best Artificial Intelligence, Machine Learning and Data Science Resources by Daniel Bourke: https://www.notion.so/The-Best-Artificial-Intelligence-Machine-Learning-and-Data-Science-Resources-b3b97fa097b747698e87fd3badc657cf
Canais e Vídeos
- Minerando Dados: https://www.youtube.com/channel/UCZ8gRCp3vixlGVAtplCDd5Q
- Canal do Ken Jee: https://www.youtube.com/channel/UCiT9RITQ9PW6BhXK0y2jaeg
- Canal Data Professor (Chanin Nantasenamat): https://www.youtube.com/channel/UCV8e2g4IWQqK71bbzGDEI4Q
- Canal 365 Data Science: https://www.youtube.com/channel/UCEBpSZhI1X8WaP-kY_2LLcg
- Trilha de estudos Data Science EstaTiDados: https://bit.ly/2n0YZ0b
Cursos
Ciência de Dados, Machine Learning, Inteligência Artificial (geral)
- Pós-Graduação em Ciência de Dados (PUC-Rio) — http://www.cce.puc-rio.br/sitecce/website/website.dll/folder?nCurso=ciencia-de-dados&nInst=ccpg (pago)
- Mestrado e Doutorado em Ciência de Dados (PUC-Rio) — http://www.inf.puc-rio.br/blog/area-de-pesquisa/ciencia-de-dados/ (pago)
- Formação Cientista de Dados (Data Science Academy) — https://www.datascienceacademy.com.br/ (pago)
- Formações Data Science Alura — https://www.alura.com.br/cursos-online-data-science (pago)
- Introdução à Ciência de Dados — https://www.datascienceacademy.com.br/pages/curso-introducao-a-ciencia-de-dados (gratuito)
- Big Data Fundamentos — https://www.datascienceacademy.com.br/pages/curso-big-data-fundamentos (gratuito)
- AI for everyone — https://www.coursera.org/learn/ai-for-everyone (gratuito)
- Machine Learning Crash Course — https://developers.google.com/machine-learning/crash-course/ (gratuito)
- Treinamentos do Kaggle — https://www.kaggle.com/learn/overview (gratuito)
- Treinamento de Machine Learning do Google — https://ai.google/education/ (gratuito)
- Intro to Machine Learning — https://www.udacity.com/course/intro-to-machine-learning--ud120 (gratuito)
- Aprendizagem Automática — https://www.coursera.org/learn/machine-learning (gratuito)
- Curso de IA do MIT — https://youtu.be/TjZBTDzGeGg (gratuito)
- Nanodegree em IA — https://www.udacity.com/course/ai-artificial-intelligence-nanodegree--nd898 (pago)
- Programa de cursos integrados Data Science (Johns Hopkins University) — https://www.coursera.org/specializations/jhu-data-science?utm_source=gg&utm_medium=sem&campaignid=426374097&adgroupid=34475309733&device=c&keyword=%2Bdata%20%2Bscience%20%2Bcourse%20%2Bonline&matchtype=b&network=g&devicemodel=&adpostion=1t1&creativeid=149996441486&hide_mobile_promo&gclid=CjwKEAjw07nJBRDG_tvshefHhWQSJABRcE-ZLNV-z2gulUMCuXEyp-mRRcsk_moZNmEHY-0A4GOnPBoCHD3w_wcB (gratuito)
- Data-driven Decision Making (PwC) — https://www.coursera.org/learn/decision-making?siteID=SAyYsTvLiGQ-qF51g6iB4QYpdQ7g0Fsh3g&utm_content=10&utm_medium=partners&utm_source=linkshare&utm_campaign=SAyYsTvLiGQ (gratuito)
- Data Science Foundations (IBM) — https://cognitiveclass.ai/learn/data-science/
- Foundations of Machine Learning (Bloomberg) — https://bloomberg.github.io/foml/#about
- Melhores cursos Andrew NG: https://pt.coursera.org/courses?query=machine%20learning%20andrew%20ng
- Formação Cientista de Dados com Python e R (Fernando Amaral): https://www.udemy.com/course/cientista-de-dados/ (pago)
- O Guia Completo de Carreira em Data Science e AI (Fernando Amaral): https://www.udemy.com/course/guia-de-carreira-em-data-science/ (pago)
- Bootcamp Cientista de Dados: 10 aplicações Web Completas (Fernando Amaral): https://www.udemy.com/course/bootcamp-cientista-de-dados/ (pago)
- Data Science e AI: 300 Testes de Conhecimento em 3 Níveis (Fernando Amaral): https://www.udemy.com/course/data-science-testes/ (pago)
- Compilação de materiais e links de Data Science: https://github.com/academic/awesome-datascience
Deep Learning, Processamento de Linguagem Natural e Text Mining
- Especialização em Deep Learning — https://pt.coursera.org/specializations/deep-learning (pago)
- Palestra de Stanford — NLP e Deep Learning — https://youtu.be/OQQ-W_63UgQ (gratuito)
- Curso de criação de Chatbots — https://www.udemy.com/chatbot/ (pago)
- Nanodegree em NLP — https://www.udacity.com/course/natural-language-processing-nanodegree--nd892 (pago)
- Deep Learning com Python de A a Z — O Curso Completo (Fernando Amaral e Jones Granatyr): https://www.udemy.com/course/deep-learning-com-python-az-curso-completo/ (pago)
Python
- Programming for Everybody (Getting Started with Python) (University of Michigan) — https://www.coursera.org/learn/python?authMode=login&errorCode=invalidCredential#faqs
- Learn Python (Code Academy) — https://external.codecademy.com/learn/learn-python
- Python For Beginners — https://external.codecademy.com/learn/learn-python-3
- Curso rápido de Python do zero — https://medium.com/trainingcenter/aprendendo-python-do-zero-b9a13d8646b3
- Python em 4 minutos — https://nerdparadise.com/programming/python4minutes/
- Curso introdutório de Python — https://curso-intro-python.readthedocs.io/introducao.html
- Curso interativo de introdução a computação com Python do IME — https://panda.ime.usp.br/aulasPython/static/aulasPython/index.html
- Python Fundamentos para Análise de Dados — https://www.datascienceacademy.com.br/pages/curso-python-fundamentos-para-analise-de-dados (gratuito)
R
- Curso-R: https://www.curso-r.com/material/
- Compilação de material de estudo de R: https://github.com/beatrizmilz/materiais_estudo_R/blob/master/README.md
Power BI
- Power BI para Data Science — https://www.datascienceacademy.com.br/pages/curso-microsoft-power-bi-para-data-science (gratuito)
- Planilheiros — Cursos de Power BI gratuitos — https://ead.planilheiros.com.br/