Proposta pedagógica
A intenção desta disciplina é fazer com que o aprendizado seja mais dinâmico e ocorra de forma simultânea, fazendo com que o aluno tenha as bases teóricas e teste-as ao mesmo tempo.
A proposta pedagógica para desenvolvimento deste curso fundamenta-se no conceito de Aprendizagem Baseada em Projetos e em Problemas
. É proposto um projeto integrador
para apreensão do conhecimento.
Ementa da disciplina
Comunicação e reprodutibilidade de dados, relatórios, apresentações e produções científicas em Rmarkdown.
Tipos de dados, Importação de base de dados, criação de objeto, operadores aritméticos, de comparação e lógicos no R.
Funções para manipulação e tratamento de dados.
Estatística descritiva e mineração de dados.
Análise textual sob perspectiva analítica.
Tratamento e análise da informação espacial.
Visualização e comunicação de informações gerenciais e científicas como subsídio ao processo decisório no R e RStudio.
Objetivos de aprendizagem
Por meio desta disciplina, os alunos desenvolverão competências para:
- Implementar comunicação e reprodutibilidade de instrumentos gerenciais e científicos por meio de linguagem RMarkdown e Git.
- Desenvolver competências para busca, manipulação e tratamento de dados utilizando R e RStudio.
- Implementar métodos de estatística descritiva exploratória e mineração de dados para gestão organizacional.
- Organizar dados e produzir análises textuais sob perspectiva analítica.
- Espacializar dados e produzir análises gerenciais que contemplem a localização como atributo decisório.
Por meio desta disciplina, os alunos desenvolverão competências para: - Implementar comunicação e reprodutibilidade de instrumentos gerenciais e científicos por meio de linguagem RMarkdown e Git.
- Desenvolver competências para busca, manipulação e tratamento de dados utilizando R e RStudio.
- Implementar métodos de estatística descritiva exploratória e mineração de dados para gestão organizacional.
- Organizar dados e produzir análises textuais sob perspectiva analítica.
- Espacializar dados e produzir análises gerenciais que contemplem a localização como atributo decisório.
- Construir instrumentos para visualização e comunicação para suporte à gestão e à tomada de decisão.
Planejamento de encontros
Os encontros acontecerão nas sextas-feiras, de 14:00 às 18:00h. Serão realizados na Sala A (informática) do PPGA.
Data | Descrição da Atividade |
---|---|
22/03 | Unidade 1: Ambientação no R, RStudio, Git-Github, Rpubs e chatGPT. Comunicação por meio do R. Lab1 |
05/04 | Unidade 1: RMarkdown como instrumento para produção de documentos estáticos e interativos, produção de websites, produção de dashboards, apresentações, livros e artigos científicos. Atividade 1. Projeto Integrador: Identificação, caracterização e diagnóstico de problemas e proposição de soluções em processos organizacionais e científicos. PI1 - definição do problema de pesquisa projeto integrador. |
12/04 | Unidade 2: Estrutura de dados no R; tipos de dados, importação de base de dados, criação de objeto (vetores, matrizes, data frames), operadores aritméticos, de comparação e lógicos Visualização de dados no R. Atividade 2 |
19/04 | Unidade 2: visualização de informações gerenciais e científicas. Lab2 |
26/04 | Unidade 3: Manipulação e transformação de dados no R: funções para manipulação e tratamento de dados. Atividade 3. PI2: coleta e inspeção de base de dados. |
03/05 | Projeto Integrador: Manipulação e transformação de dados no R: funções para manipulação e tratamento de dados do Projeto Integrador. PI3 |
10/05 | Unidade 3: Estatística descritiva e mineração de dados. Lab3 |
17/05 | Projeto Integrador: Estatística descritiva e mineração de dados do projeto integrador. PI4 |
24/05 | Unidade 4: Segmentação de mercado. Lab4 |
07/06 | Unidade 5: Organização dados e produção de análises textuais sob perspectiva analítica. Lab5 |
14/06 | Unidade 6: Introdução aos dados espaciais |
21/06 | Unidade 6: Espacialização dados e produção de análises gerenciais que contemplem a localização como atributo decisório. Lab6 |
28/06 | Projeto Integrador: Consolidação dos resultados e dos instrumentos de visualização e comunicação de informações gerenciais e científicas para subsídio ao processo decisório. |
05/07 | Projeto Integrador: Entrega do relatório/dashboard/site (e outros instrumentos) do projeto integrador para o grupo que fará a avaliação do documento como instrumento de tomada de decisão. PI5 |
12/07 | Apresentação do projeto integrador - PI6 e relato do grupo avaliador PI7. |
Total de Horas | 60 horas |
Proposta de avaliação da aprendizagem
A aprendizagem na disciplina será avaliada por meio da consolidação de atividades alinhadas com os objetivos de aprendizagem (Labs e atividades de aprendizagem) e por meio da elaboração de um projeto transversal aos objetivos, o projeto integrador, também com entregas segmentadas ao longo do semestre letivo.
Pontos | Atividade |
---|---|
5 | Lab 1 – Introdução do R e IDE RStudio. RMarkdown. |
5 | Lab 2 – Tipos de dados e objetos no R. Visualização de dados – base ggplot2 |
5 | Lab 3 – Importação e introdução ao tratamento de dados no R. Tratamento de dados - dplyr. Junção de múltiplos dataframes. Estatística Descritiva e Mineração de dados. |
10 | Lab 4 – Segmentação de mercado. |
5 | Lab 5 – Organização dados e produção de análises textuais sob perspectiva analítica |
10 | Lab 6 – Espacialização dados e produção de análises gerenciais que contemplem a localização como atributo decisório |
5 | Atividade 1 – Introdução do R e IDE RStudio. RMarkdown. |
5 | Atividade 2 – Tipos de dados e objetos no R. Visualização de dados – base ggplot2 |
5 | Atividade 3 – Importação e introdução ao tratamento de dados no R. Tratamento de dados - dplyr. Junção de múltiplos dataframes. Estatística Descritiva e Mineração de dados. |
5 | PI 1 – Definição do problema e dos objetivos da investigação |
5 | PI 2 – Coleta e inspeção de base de dados |
5 | PI 3 – Consolidação da base de dados |
5 | PI 4 – AED |
10 | PI 5 – Instrumento de suporte ao processo decisório |
5 | PI 6 – Apresentação do PI |
10 | PI 7 – Avaliação pelo grupo designado. |
TOTAL: | 100 pontos |
Requisitos básicos e expectativas iniciais
Os participantes não precisam apresentar conhecimento prévio de computação, pacotes estatísticos ou manejo de conjuntos de dados. Se você é daquelas pessoas que, como eu há muito pouco tempo atrás, arrepia ao ver códigos
na sua frente e tem certeza que nasceu sem a capacidade desenvolver quaisquer análises que envolvam linha de comando
, você está no lugar certo! Fique tranquilo pois a proposta é que todos consigam acompanhar a disciplina e diferentes competências e inteligências são muito bem vindas! Vamos desconstruir essa ideia de que analistas, gestores e engenheiros não são formados para usar linguagem computacional.
Não quero que você se torne um desenvolvedor com este curso. Ele tem como proposta a ampliação das possibilidades de análise de sistemas organizacionais e suporte ao processo decisório. O R
é uma linguagem acessível a todos.
A avaliação priorizará o esforço e a criatividade apresentados em detrimento da finalização das propostas e projetos. Ou seja, para encorajar todos os estudantes, códigos com erros, mas bem elaborados, são um ótimo produto a ser entregue ao longo da disciplina, como forma de encorajar estudantes iniciantes.
Recursos necessários
Computador com Sistema Operacional à escolha do estudante para desenvolver as atividades. Os softwares a serem instalados são:
- R (Windows) - https://cran.r-project.org/bin/windows/base/
- RStudio (Windows) - https://rstudio.com/products/rstudio/download/
- Git - https://git-scm.com/downloads
Os alunos deverão ter uma conta gratuita nas plataformas:
A turma virtual do SIGAA será utilizada para postagens de conteúdos e outras comunicações.
Bibliografia recomendada sobre análise de dados aplicada a processos decisórios
- FAWCETT, T; PROVOST, F. Data Science Para Negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados. Edição: 1ª. Número de Páginas: 408 Editora Alta Books.
- RAGSDALE, Cliff T. Modelagem de planilha e análise de decisão: uma introdução prática a business analytics. Revisão de João Luiz Becker. São Paulo: Saraiva, c2015. xi, 594 p., il. Inclui referências e índice. ISBN 9788522117741.
- SHARDA, Ramesh. Business intelligence and analytics: systems for decision support. 10. ed. Boston: Pearson, c2015. xxx, 656 p., il. Inclui referências, glossário e índice. ISBN 9780133050905.
- NISHISATO, S. Analysis of Categorical Data: Dual Scaling and Its Applications. Toronto: University of Toronto Press, Scholarly Publishing Division, 2018. ISBN 9781487578909. Disponível em: http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2027628&lang=pt-br&site=ehost-live. Acesso em: 22 out. 2020.
- TSAY, Ruey S. Multivariate time series analysis: with R and financial applications. New Jersey: John Wiley & Sons, 2014.
- TROSSET, Michael W. An introduction to statistical inference and its applications with R. Boca Raton: Chapman and Hall/CRC, 2009.
- PARADIS, Emanuel. R for Beginners. Monpellier: Institut des Sciences de l’Evolution, 2005. Disponível em: https://cran.r-project.org/doc/contrib/Paradis-rdebuts_en.pdf. Acesso em: 12 nov. 2019. - TEETOR, Paul. R cookbook: Proven recipes for data analysis, statistics, and graphics. Sebastopol: O’Reilly Media, Inc., 2011.
- Zen do R - https://curso-r.github.io/zen-do-r/index.html
- FÁVERO, Luiz Paulo. Análise de dados: modelos de regressão com Excel, STATA e SPSS. Rio de Janeiro: Elsevier, 2015.
- MINGOTI, Sueli Aparecida. Análise de dados através de métodos de estatística multivariada: uma abordagem aplicada. Belo Horizonte: Editora UFMG, 2005.
- CUESTA, H. Practical Data Analysis. Birmingham, UK: Packt Publishing, 2013. Disponível em: http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=654543&lang=pt-br&site=ehost-live. Acesso em: 22 out. 2020.
- SHARDA, Ramesh. Business intelligence and analytics: systems for decision support. 10. ed. Boston: Pearson, 2015.
- NISHISATO, S. Analysis of Categorical Data: dual scaling and its applications. Toronto: University of Toronto Press, Scholarly Publishing Division, 2018. Disponível em: http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2027628&lang=pt-br&site=ehost-live. Acesso em: 22 out. 2020.
- LAURSEN, Gert H. N. Business Analytics for Sales and Marketing Managers: how to compete in the information age. Hoboken, N.Y.: Wiley, 2011. Disponível em: http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=363582&lang=pt-br&site=ehost-live. Acesso em: 22 out. 2020.
- DAVENPORT, Thomas H. Inteligência Analítica nos Negócios: como usar a análise de informações para obter resultados superiores. Tradução: Ana Beatriz Rodrigues. São Paulo: Elsevier, 2010.
Material adicional
R Project
Reproductible research
Comunicação
Toda comunicação individual com a docente deverá acontecer por meio do email institucional do docente, deve conter no campo “assunto” o texto <DADOS-PPGA>
e deve ser assinada com seu nome completo. Por favor, utilize o email institucional para comunicação com o docente: renataoliveira@cefetmg.br
Políticas institucionais e da disciplina
Os estudantes e professores têm a responsabilidade de manter um ambiente de aprendizagem adequado e motivante. Aqueles que não aderirem a tais padrões de comportamento podem estar sujeitos ao regime disciplinar da instituição. A cortesia profissional e a sensibilidade são especialmente importantes no que diz respeito a indivíduos e discussões que lidam com diferenças de raça, cor, cultura, religião, credo, política, status de veterano, orientação sexual, gênero, identidade e expressão de gênero, idade, deficiência e nacionalidades. As listas de classes são fornecidas ao instrutor com o nome legal do aluno. Terei prazer em honrar seu pedido de dirigir-se a você por um nome alternativo ou pronome de gênero. Por favor, me informe essa preferência no início do semestre para que eu possa fazer as mudanças apropriadas em seus registros.
Não serão tolerados atos de discriminação ou assédio contra ou por qualquer funcionário ou estudante.
Honestidade acadêmica é um princípio fundamental desta disciplina. Desonestidade acadêmica configura-se por: cópias literais de textos ou ideias sem citação de fonte, fabricações e falsificações de qualquer natureza, plágio, mentira, suborno, comportamento ameaçador ou cumplicidade com desonestidade acadêmica em qualquer nível. Os estudantes que forem considerados em violação da política de integridade acadêmica estarão sujeitos tanto a sanções acadêmicas do membro docente quanto a sanções não acadêmicas. Se você tiver alguma dúvida sobre citações adequadas, configuração de plágio, etc., por favor, não hesite em perguntar!