Perguntas com a marcação «dataframe»

Um quadro de dados é uma estrutura de dados tabular. Geralmente, ele contém dados em que linhas são observações e colunas são variáveis ​​de vários tipos. Enquanto "quadro de dados" ou "quadro de dados" é o termo usado para esse conceito em várias línguas (R, Apache Spark, deedle, Maple, a biblioteca de pandas em Python e a biblioteca de DataFrames em Julia), "tabela" é o termo usado em MATLAB e SQL.


6
seleção de pandas com vários índices
Eu tenho um quadro de dados de vários índices com colunas 'A' e 'B'. Existe uma maneira de selecionar linhas filtrando em uma coluna do multi-índice sem redefinir o índice para um índice de coluna única? Por exemplo. # has multi-index (A,B) df #can I do this? I know this …


13
Comparando dois dataframes e obtendo as diferenças
Eu tenho dois dataframes. Exemplos: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple 22.1 …

5
Spark DataFrame groupBy e classificação em ordem decrescente (pyspark)
Estou usando o pyspark (Python 2.7.9 / Spark 1.3.1) e tenho um GroupObject de dataframe que preciso filtrar e classificar em ordem decrescente. Tentar consegui-lo por meio deste pedaço de código. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Mas isso gera o seguinte erro. sort() got an unexpected keyword argument 'ascending'

5
como dividir a coluna de tuplas no dataframe do pandas?
Eu tenho um dataframe do pandas (este é apenas um pequeno pedaço) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) …




1
Aplicar função a cada célula no DataFrame
Eu tenho um dataframe que pode ser parecido com este: A B C foo bar foo bar bar foo foo bar Quero examinar cada elemento de cada linha (ou cada elemento de cada coluna) e aplicar a seguinte função para obter o DF subsequente: def foo_bar(x): return x.replace('foo', 'wow') A …

7
Selecione a primeira linha por grupo
De um dataframe como este test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ] rownames(test) <- 1:10 > test id string 1 1 A 2 1 F 3 2 B 4 2 G 5 3 C 6 3 H 7 4 D 8 4 I 9 5 E 10 …
87 r  dataframe  sqldf 

5
Mudar coluna em um dataframe do pandas?
Eu tenho um dataframe do pandas. Eu quero 'retardar' uma de minhas colunas. Isso significa, por exemplo, deslocar a coluna inteira 'gdp' para cima em um e, em seguida, remover todos os dados em excesso na parte inferior das linhas restantes para que todas as colunas tenham o mesmo comprimento …


5
Converter vetor de caracteres nomeados em data.frame
Eu tenho um vetor de caractere nomeado retornado de xmlAttrs como este: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Eu gostaria de convertê-lo em um quadro de dados parecido com este: testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.