Para uma solução livre de dependências externas complicadas *, agora existe readxl
:
O pacote readxl facilita a obtenção de dados do Excel e para o R. Comparado com muitos dos pacotes existentes (por exemplo, gdata, xlsx, xlsReadWrite), readxl não tem dependências externas, portanto é fácil de instalar e usar em todos os sistemas operacionais. Ele é projetado para trabalhar com dados tabulares armazenados em uma única folha.
Readxl suporta o formato .xls legado e o formato .xlsx moderno baseado em xml. O suporte a .xls é possível com a biblioteca C com libxls, que abstrai muitas das complexidades do formato binário subjacente. Para analisar .xlsx, usamos a biblioteca RapidXML C ++.
Ele pode ser instalado assim:
install.packages("readxl") # CRAN version
ou
devtools::install_github("hadley/readxl") # development version
Uso
library(readxl)
# read_excel reads both xls and xlsx files
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
# Specify sheet with a number or name
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
# If NAs are represented by something other than blank cells,
# set the na argument
read_excel("my-spreadsheet.xls", na = "NA")
* não é estritamente verdadeiro, requer o Rcpp
pacote , que por sua vez requer Rtools (para Windows) ou Xcode (para OSX), que são dependências externas a R. Mas eles não requerem qualquer manipulação de caminhos, etc., então isso é um vantagem sobre as dependências Java e Perl.
Atualizar Agora existe o pacote rexcel . Isso promete obter a formatação, funções e muitos outros tipos de informações do Excel do arquivo do Excel para o R.
.csv
.