Análise de Dados aplicada ao processo decisório

Proposta pedagógica

A intenção desta disciplina é fazer com que o aprendizado seja mais dinâmico e ocorra de forma simultânea, fazendo com que o aluno tenha as bases teóricas e teste-as ao mesmo tempo.

A proposta pedagógica para desenvolvimento deste curso fundamenta-se no conceito de Aprendizagem Baseada em Projetos e em Problemas. É proposto um projeto integrador para apreensão do conhecimento.

Ementa da disciplina

  • Comunicação e reprodutibilidade de dados, relatórios, apresentações e produções científicas em Rmarkdown.

  • Tipos de dados, Importação de base de dados, criação de objeto, operadores aritméticos, de comparação e lógicos no R.

  • Funções para manipulação e tratamento de dados.

  • Estatística descritiva e mineração de dados.

  • Análise textual sob perspectiva analítica.

  • Tratamento e análise da informação espacial.

  • Visualização e comunicação de informações gerenciais e científicas como subsídio ao processo decisório no R e RStudio.

Objetivos de aprendizagem

Por meio desta disciplina, os alunos desenvolverão competências para:

  1. Implementar comunicação e reprodutibilidade de instrumentos gerenciais e científicos por meio de linguagem RMarkdown e Git.
  2. Desenvolver competências para busca, manipulação e tratamento de dados utilizando R e RStudio.
  3. Implementar métodos de estatística descritiva exploratória e mineração de dados para gestão organizacional.
  4. Organizar dados e produzir análises textuais sob perspectiva analítica.
  5. Espacializar dados e produzir análises gerenciais que contemplem a localização como atributo decisório.
    Por meio desta disciplina, os alunos desenvolverão competências para:
  6. Implementar comunicação e reprodutibilidade de instrumentos gerenciais e científicos por meio de linguagem RMarkdown e Git.
  7. Desenvolver competências para busca, manipulação e tratamento de dados utilizando R e RStudio.
  8. Implementar métodos de estatística descritiva exploratória e mineração de dados para gestão organizacional.
  9. Organizar dados e produzir análises textuais sob perspectiva analítica.
  10. Espacializar dados e produzir análises gerenciais que contemplem a localização como atributo decisório.
  11. Construir instrumentos para visualização e comunicação para suporte à gestão e à tomada de decisão.

Planejamento de encontros

Os encontros acontecerão nas sextas-feiras, de 14:00 às 18:00h. Serão realizados na Sala A (informática) do PPGA.

DataDescrição da Atividade
22/03Unidade 1: Ambientação no R, RStudio, Git-Github, Rpubs e chatGPT. Comunicação por meio do R. Lab1
05/04Unidade 1: RMarkdown como instrumento para produção de documentos estáticos e interativos, produção de websites, produção de dashboards, apresentações, livros e artigos científicos. Atividade 1. Projeto Integrador: Identificação, caracterização e diagnóstico de problemas e proposição de soluções em processos organizacionais e científicos. PI1 - definição do problema de pesquisa projeto integrador.
12/04Unidade 2: Estrutura de dados no R; tipos de dados, importação de base de dados, criação de objeto (vetores, matrizes, data frames), operadores aritméticos, de comparação e lógicos Visualização de dados no R. Atividade 2
19/04Unidade 2: visualização de informações gerenciais e científicas. Lab2
26/04Unidade 3: Manipulação e transformação de dados no R: funções para manipulação e tratamento de dados. Atividade 3. PI2: coleta e inspeção de base de dados.
03/05Projeto Integrador: Manipulação e transformação de dados no R: funções para manipulação e tratamento de dados do Projeto Integrador. PI3
10/05Unidade 3: Estatística descritiva e mineração de dados. Lab3
17/05Projeto Integrador: Estatística descritiva e mineração de dados do projeto integrador. PI4
24/05Unidade 4: Segmentação de mercado. Lab4
07/06Unidade 5: Organização dados e produção de análises textuais sob perspectiva analítica. Lab5
14/06Unidade 6: Introdução aos dados espaciais
21/06Unidade 6: Espacialização dados e produção de análises gerenciais que contemplem a localização como atributo decisório. Lab6
28/06Projeto Integrador: Consolidação dos resultados e dos instrumentos de visualização e comunicação de informações gerenciais e científicas para subsídio ao processo decisório.
05/07Projeto Integrador: Entrega do relatório/dashboard/site (e outros instrumentos) do projeto integrador para o grupo que fará a avaliação do documento como instrumento de tomada de decisão. PI5
12/07Apresentação do projeto integrador - PI6 e relato do grupo avaliador PI7.
Total de Horas60 horas

Proposta de avaliação da aprendizagem

A aprendizagem na disciplina será avaliada por meio da consolidação de atividades alinhadas com os objetivos de aprendizagem (Labs e atividades de aprendizagem) e por meio da elaboração de um projeto transversal aos objetivos, o projeto integrador, também com entregas segmentadas ao longo do semestre letivo.

PontosAtividade
5Lab 1 – Introdução do R e IDE RStudio. RMarkdown.
5Lab 2 – Tipos de dados e objetos no R. Visualização de dados – base ggplot2
5Lab 3 – Importação e introdução ao tratamento de dados no R. Tratamento de dados - dplyr. Junção de múltiplos dataframes. Estatística Descritiva e Mineração de dados.
10Lab 4 – Segmentação de mercado.
5Lab 5 – Organização dados e produção de análises textuais sob perspectiva analítica
10Lab 6 – Espacialização dados e produção de análises gerenciais que contemplem a localização como atributo decisório
5Atividade 1 – Introdução do R e IDE RStudio. RMarkdown.
5Atividade 2 – Tipos de dados e objetos no R. Visualização de dados – base ggplot2
5Atividade 3 – Importação e introdução ao tratamento de dados no R. Tratamento de dados - dplyr. Junção de múltiplos dataframes. Estatística Descritiva e Mineração de dados.
5PI 1 – Definição do problema e dos objetivos da investigação
5PI 2 – Coleta e inspeção de base de dados
5PI 3 – Consolidação da base de dados
5PI 4 – AED
10PI 5 – Instrumento de suporte ao processo decisório
5PI 6 – Apresentação do PI
10PI 7 – Avaliação pelo grupo designado.
TOTAL:100 pontos

Requisitos básicos e expectativas iniciais

Os participantes não precisam apresentar conhecimento prévio de computação, pacotes estatísticos ou manejo de conjuntos de dados. Se você é daquelas pessoas que, como eu há muito pouco tempo atrás, arrepia ao ver códigos na sua frente e tem certeza que nasceu sem a capacidade desenvolver quaisquer análises que envolvam linha de comando, você está no lugar certo! Fique tranquilo pois a proposta é que todos consigam acompanhar a disciplina e diferentes competências e inteligências são muito bem vindas! Vamos desconstruir essa ideia de que analistas, gestores e engenheiros não são formados para usar linguagem computacional.

Não quero que você se torne um desenvolvedor com este curso. Ele tem como proposta a ampliação das possibilidades de análise de sistemas organizacionais e suporte ao processo decisório. O R é uma linguagem acessível a todos.

A avaliação priorizará o esforço e a criatividade apresentados em detrimento da finalização das propostas e projetos. Ou seja, para encorajar todos os estudantes, códigos com erros, mas bem elaborados, são um ótimo produto a ser entregue ao longo da disciplina, como forma de encorajar estudantes iniciantes.

Recursos necessários

Computador com Sistema Operacional à escolha do estudante para desenvolver as atividades. Os softwares a serem instalados são:

Os alunos deverão ter uma conta gratuita nas plataformas:

  • github.com. Recomendamos também que se cadastrem no RPubs

  • ChatGPT - ChatGPT

A turma virtual do SIGAA será utilizada para postagens de conteúdos e outras comunicações.

Bibliografia recomendada sobre análise de dados aplicada a processos decisórios

  • FAWCETT, T; PROVOST, F. Data Science Para Negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados. Edição: 1ª. Número de Páginas: 408 Editora Alta Books.
  • RAGSDALE, Cliff T. Modelagem de planilha e análise de decisão: uma introdução prática a business analytics. Revisão de João Luiz Becker. São Paulo: Saraiva, c2015. xi, 594 p., il. Inclui referências e índice. ISBN 9788522117741.
  • SHARDA, Ramesh. Business intelligence and analytics: systems for decision support. 10. ed. Boston: Pearson, c2015. xxx, 656 p., il. Inclui referências, glossário e índice. ISBN 9780133050905.
  • NISHISATO, S. Analysis of Categorical Data: Dual Scaling and Its Applications. Toronto: University of Toronto Press, Scholarly Publishing Division, 2018. ISBN 9781487578909. Disponível em: http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2027628&lang=pt-br&site=ehost-live. Acesso em: 22 out. 2020.
  • TSAY, Ruey S. Multivariate time series analysis: with R and financial applications. New Jersey: John Wiley & Sons, 2014.
  • TROSSET, Michael W. An introduction to statistical inference and its applications with R. Boca Raton: Chapman and Hall/CRC, 2009.
  • PARADIS, Emanuel. R for Beginners. Monpellier: Institut des Sciences de l’Evolution, 2005. Disponível em: https://cran.r-project.org/doc/contrib/Paradis-rdebuts_en.pdf. Acesso em: 12 nov. 2019. - TEETOR, Paul. R cookbook: Proven recipes for data analysis, statistics, and graphics. Sebastopol: O’Reilly Media, Inc., 2011.
  • Zen do R - https://curso-r.github.io/zen-do-r/index.html
  • FÁVERO, Luiz Paulo. Análise de dados: modelos de regressão com Excel, STATA e SPSS. Rio de Janeiro: Elsevier, 2015.
  • MINGOTI, Sueli Aparecida. Análise de dados através de métodos de estatística multivariada: uma abordagem aplicada. Belo Horizonte: Editora UFMG, 2005.
  • CUESTA, H. Practical Data Analysis. Birmingham, UK: Packt Publishing, 2013. Disponível em: http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=654543&lang=pt-br&site=ehost-live. Acesso em: 22 out. 2020.
  • SHARDA, Ramesh. Business intelligence and analytics: systems for decision support. 10. ed. Boston: Pearson, 2015.
  • NISHISATO, S. Analysis of Categorical Data: dual scaling and its applications. Toronto: University of Toronto Press, Scholarly Publishing Division, 2018. Disponível em: http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2027628&lang=pt-br&site=ehost-live. Acesso em: 22 out. 2020.
  • LAURSEN, Gert H. N. Business Analytics for Sales and Marketing Managers: how to compete in the information age. Hoboken, N.Y.: Wiley, 2011. Disponível em: http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=363582&lang=pt-br&site=ehost-live. Acesso em: 22 out. 2020.
  • DAVENPORT, Thomas H. Inteligência Analítica nos Negócios: como usar a análise de informações para obter resultados superiores. Tradução: Ana Beatriz Rodrigues. São Paulo: Elsevier, 2010.

Material adicional

R Project
Reproductible research

Comunicação

Toda comunicação individual com a docente deverá acontecer por meio do email institucional do docente, deve conter no campo “assunto” o texto <DADOS-PPGA> e deve ser assinada com seu nome completo. Por favor, utilize o email institucional para comunicação com o docente: renataoliveira@cefetmg.br

Políticas institucionais e da disciplina

Os estudantes e professores têm a responsabilidade de manter um ambiente de aprendizagem adequado e motivante. Aqueles que não aderirem a tais padrões de comportamento podem estar sujeitos ao regime disciplinar da instituição. A cortesia profissional e a sensibilidade são especialmente importantes no que diz respeito a indivíduos e discussões que lidam com diferenças de raça, cor, cultura, religião, credo, política, status de veterano, orientação sexual, gênero, identidade e expressão de gênero, idade, deficiência e nacionalidades. As listas de classes são fornecidas ao instrutor com o nome legal do aluno. Terei prazer em honrar seu pedido de dirigir-se a você por um nome alternativo ou pronome de gênero. Por favor, me informe essa preferência no início do semestre para que eu possa fazer as mudanças apropriadas em seus registros.

Não serão tolerados atos de discriminação ou assédio contra ou por qualquer funcionário ou estudante.

Honestidade acadêmica é um princípio fundamental desta disciplina. Desonestidade acadêmica configura-se por: cópias literais de textos ou ideias sem citação de fonte, fabricações e falsificações de qualquer natureza, plágio, mentira, suborno, comportamento ameaçador ou cumplicidade com desonestidade acadêmica em qualquer nível. Os estudantes que forem considerados em violação da política de integridade acadêmica estarão sujeitos tanto a sanções acadêmicas do membro docente quanto a sanções não acadêmicas. Se você tiver alguma dúvida sobre citações adequadas, configuração de plágio, etc., por favor, não hesite em perguntar!