Perguntas com a marcação «dataframe»

Um quadro de dados é uma estrutura de dados tabular. Geralmente, ele contém dados em que linhas são observações e colunas são variáveis ​​de vários tipos. Enquanto "quadro de dados" ou "quadro de dados" é o termo usado para esse conceito em várias línguas (R, Apache Spark, deedle, Maple, a biblioteca de pandas em Python e a biblioteca de DataFrames em Julia), "tabela" é o termo usado em MATLAB e SQL.


11
Como soltar colunas por nome em um quadro de dados
Eu tenho um grande conjunto de dados e gostaria de ler colunas específicas ou descartar todas as outras. data <- read.dta("file.dta") Eu seleciono as colunas nas quais não estou interessado: var.out <- names(data)[!names(data) %in% c("iden", "name", "x_serv", "m_serv")] e do que eu gostaria de fazer algo como: for(i in 1:length(var.out)) …
304 r  dataframe  subset 

15
Converter dict Python em um dataframe
Eu tenho um dicionário Python como o seguinte: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, …
299 python  pandas  dataframe 


11
Como acessar o último valor em um vetor?
Suponha que eu tenha um vetor aninhado em um dataframe em um ou dois níveis. Existe uma maneira rápida e suja de acessar o último valor, sem usar a length()função? Algo ala PERL$# var especial ? Então, eu gostaria de algo como: dat$vec1$vec2[$#] ao invés de dat$vec1$vec2[length(dat$vec1$vec2)]
289 r  dataframe  vector 



3
Como verificar se existe uma coluna no Pandas
Existe uma maneira de verificar se existe uma coluna em um DataFrame do Pandas? Suponha que eu tenha o seguinte DataFrame: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, …
274 python  pandas  dataframe 

21
O que significa eixo nos pandas?
Aqui está o meu código para gerar um quadro de dados: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) então eu peguei o dataframe: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ Quando digito o comando: dff.mean(axis=1) Eu tenho : 0 …

6
Remova uma coluna inteira de um data.frame em R
Alguém sabe como remover uma coluna inteira de um data.frame no R? Por exemplo, se eu receber esse data.frame: > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon e eu …
267 r  dataframe 

10
Como pegar fatias de coluna do dataframe nos pandas
Carrego alguns dados de aprendizado de máquina de um arquivo CSV. As duas primeiras colunas são observações e as colunas restantes são recursos. Atualmente, faço o seguinte: data = pandas.read_csv('mydata.csv') o que dá algo como: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) Eu gostaria de cortar esta trama de dados em …


9
Mesclar simultaneamente vários data.frames em uma lista
Eu tenho uma lista de muitos data.frames que quero mesclar. O problema aqui é que cada data.frame difere em termos de número de linhas e colunas, mas todos compartilham as principais variáveis ​​(que eu chamei "var1"e "var2"no código abaixo). Se os data.frames fossem idênticos em termos de colunas, eu poderia …
259 r  list  merge  dataframe  r-faq 



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.