Instalação e uso do Package tidyverse
Instale todos os pacotes no tidyverse executando install.packages("tidyverse")
.
Execute a library(tidyverse)
para carregar o núcleo do tidyverse e torná-lo disponível em sua sessão R atual.
Saiba mais sobre o pacote tidyverse em https://tidyverse.tidyverse.org.
Estrutura básica do tidyverse
A estrutura básica do tidyverse inclui os pacotes que você provavelmente usará nas análises de dados. Os seguintes pacotes estão incluídos:
ggplot2
O ggplot2
é um sistema de criação gráfica declarativa, baseado na Gramática de gráficos. Você fornece os dados, diz ao ggplot2
como mapear variáveis para a estética, quais elementos gráficos utilizar, e ele cuida dos detalhes.
dplyr
dplyr
fornece uma gramática de manipulação de dados, fornecendo um conjunto consistente de comandos que resolvem os desafios mais comuns de manipulação de dados.
tidyr
tidyr
fornece um conjunto de funções que ajudam você a obter organizar os dados. Dados organizados são dados com uma estrutura consistente: em resumo, cada variável vai em uma coluna, e cada coluna é uma variável.
readr
readr
fornece uma maneira rápida e amigável de ler dados tabulares (como csv, tsv, e fwf). Ele é projetado para analisar de forma flexível muitos tipos de dados.
purrr
purrr
melhora o conjunto de ferramentas de programação funcional (FP) do R
, fornecendo um conjunto completo e consistente de ferramentas para trabalhar com funções e vetores. Uma vez que você domina os conceitos básicos, o purrr
permite que você substitua muitos loops
por códigos mais fáceis de escrever e mais expressivos.
tibble
tibble
é uma representação moderna do dataframe
. Tibbles
são dataframes preguiçosos e rudes: eles fazem menos e reclamam mais, forçando você a enfrentar os problemas mais cedo, normalmente levando a um código mais limpo e expressivo.
stringr
stringr
fornece um conjunto coeso de funções projetadas para tornar o trabalho com texto o mais fácil possível. Ele é construído sobre o stringi
, que usa a biblioteca ICU C
para fornecer implementações rápidas e corretas de manipulações comuns de texto
forcats
forcats
fornece um conjunto de ferramentas úteis que resolvem problemas comuns com fatores. R utiliza fatores para lidar com variáveis categóricas, variáveis que têm um conjunto fixo e conhecido de valores possíveis.
O tidyverse
também inclui muitos outros pacotes com uso mais especializado. Eles não são carregados automaticamente com biblioteca(tidyverse)
, então você precisará carregar cada um deles com sua própria chamada à biblioteca.
Importação de dados
Assim como o readr
, o pacote tidyverse instala uma série de outros pacotes para a leitura de dados:
DBI
para bancos de dados relacionais. Você precisará emparelharDBI
com um backend específico de banco de dados comoRSQLite
,RMariaDB
,RPostgres
, ouodbc.
Saiba mais em https://db.rstudio.com.haven
para dados SPSS, Stata, e SAS.httr
para web APIs.readxl
para planilhas .xls e .xlsx.rvest
para raspagem da web.jsonlite
para JSON. (mantido por Jeroen Ooms.)xml2
para XML.
Wrangle
Além de tidyr
e dplyr
, há cinco pacotes (incluindo stringr
e forcats
) que são projetados para trabalhar com tipos específicos de dados:
Programa
Além do purrr
, que fornece métodos muito consistentes e naturais para iteração em objetos R, há dois pacotes adicionais que ajudam nos desafios gerais de programação:
Modelo
A modelagem com o tidyverse
possibilita a coleção de pacotes de tidymodels
, que em grande parte substituem o pacote modelr
usado no R4DS.
Estes pacotes fornecem uma base abrangente para a criação e utilização de modelos de todos os tipos. Visite o Guia de Introdução ou, para exemplos mais detalhados, vá direto para a página Aprender.