Projetos De Ciência De Dados Com Python
Abordagem De Estudo De Caso Para A Criação De Projetos De Ciência De Dados Bem-Sucedidos Usando Python, Pandas E Scikit-Learn
de Stephen Klosterman
Formatos Disponíveis:
Sobre o livro
Projetos de ciência de dados com Python foi pensado para oferecer orientação prática sobre ferramentas padrão para análise de dados e machine learning em Python com a ajuda de dados reais. O curso o ajudará a entender como usar pandas e o Matplotlib para examinar criticamente um dataset com sínteses estatísticas e gráficos e extrair os insights que deseja obter. Você continuará adquirindo conhecimento ao aprender a preparar dados e a fornecê-los para algoritmos de machine learning, como o de regressão logística regularizada e o de floresta aleatória, usando o pacote scikit-learn. Também aprenderá como ajustar algoritmos para fornecer as melhores previsões sobre dados novos não conhecidos. À medida que percorrer os capítulos mais avançados, conhecerá o funcionamento e a saída desses algoritmos e entenderá melhor não só os recursos preditivos dos modelos, mas também o que os leva a fazer essas previsões. No fim do curso, você terá as habilidades necessárias para usar confiantemente vários algoritmos de machine learning a fim de executar análises de dados detalhadas e extrair insights significativos dos dados. Objetivos do livro: • Instalação dos pacotes necessários para a definição de um ambiente de codificação de ciência de dados • Carregamento de dados em um Jupyter Notebook executando Python • Uso do Matplotlib para a criação de visualizações de dados • Criação de um modelo com o uso do scikit-learn • Uso do lasso e da regressão ridge para dedução do overfitting • Criação e ajuste de um modelo de floresta aleatória e comparação do desempenho com o da regressão logística • Criação de visualizações com o uso da saída do Jupyter Notebook.