Eu tenho um conjunto de dados ascii que consiste em três colunas, mas apenas as duas últimas são dados reais. Agora eu quero criar um pontochart dos dados usando read.csv(file = "result1", sep= " "). R lê todas as três colunas. Como evito isso?
Eu tenho um conjunto de dados ascii que consiste em três colunas, mas apenas as duas últimas são dados reais. Agora eu quero criar um pontochart dos dados usando read.csv(file = "result1", sep= " "). R lê todas as três colunas. Como evito isso?
Respostas:
Você pode usar o colClassesargumento para read.csvpara selecionar as colunas que deseja. Nesse caso, você pode definir colClassescomoc("NULL", NA, NA)
read.csv(file="result1", sep=" ", colClasses=c("NULL", NA, NA))
De maneira mais geral, você pode usar colClasses para especificar os tipos específicos de colunas; NAsignifica usar a abordagem padrão, que é tentar descobrir qual é a coluna automaticamente. Veja a página de ajuda read.csvpara mais detalhes.
Outra opção é ler o arquivo inteiro, mas mantenha apenas duas das colunas, por exemplo:
read.csv(file = "result1", sep = " ")[ ,1:2]
ou, usando nomes de colunas, por exemplo. se as colunas forem nomeadas 'col1, col2, col3'
read.csv(file = "result1", sep = " ")[ ,c('col1', 'col2')]
Este leva menos tempo em comparação com as respostas fornecidas
library(data.table)
fread(file="result1", sep=" ", colClasses=c("NULL", NA, NA))