Perguntas com a marcação «dataframe»

Um quadro de dados é uma estrutura de dados tabular. Geralmente, ele contém dados em que linhas são observações e colunas são variáveis ​​de vários tipos. Enquanto "quadro de dados" ou "quadro de dados" é o termo usado para esse conceito em várias línguas (R, Apache Spark, deedle, Maple, a biblioteca de pandas em Python e a biblioteca de DataFrames em Julia), "tabela" é o termo usado em MATLAB e SQL.


8
pandas valores únicos várias colunas
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Qual é a melhor maneira de retornar os valores exclusivos de 'Col1' e 'Col2'? A saída desejada é 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

4
Pandas Python: preencher um quadro de dados linha por linha
A tarefa simples de adicionar uma linha a um pandas.DataFrameobjeto parece ser difícil de realizar. Existem três perguntas sobre o stackoverflow relacionadas a isso, nenhuma das quais fornece uma resposta útil. Aqui está o que estou tentando fazer. Eu tenho um DataFrame do qual eu já conheço a forma e …
133 python  dataframe  row  pandas 



8
Omitir linhas contendo coluna específica de NA
Quero saber como omitir NAvalores em um quadro de dados, mas apenas em algumas colunas em que estou interessado. Por exemplo, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) mas eu só quero omitir os dados onde yestá NA, portanto o resultado deve …
129 r  dataframe  na 


5
R - Concatenar dois quadros de dados?
Dados dois quadros de dados ae b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570 1.7916780 4 -1.3645337 1.3642276 5 -0.4954542 …

10
Como adicionar uma linha a um quadro de dados no R?
No R, como você adiciona uma nova linha a um quadro de dados depois que o quadro de dados já foi inicializado? Até agora eu tenho o seguinte: df <- data.frame("hi", "bye") names(df) <- c("hello", "goodbye") #I am trying to add "hola" and "ciao" as a new row de <- …
129 r  dataframe 



9
Como adiciono uma nova coluna a um Spark DataFrame (usando PySpark)?
Eu tenho um Spark DataFrame (usando o PySpark 1.5.1) e gostaria de adicionar uma nova coluna. Eu tentei o seguinte sem sucesso: type(randomed_hours) # => list # Create in Python and transform to RDD new_col = pd.DataFrame(randomed_hours, columns=['new_col']) spark_new_col = sqlContext.createDataFrame(new_col) my_df_spark.withColumn("hours", spark_new_col["new_col"]) Também ocorreu um erro ao usar este: …



5
Adicionar datas ausentes ao quadro de dados do pandas
Meus dados podem ter vários eventos em uma determinada data ou NENHUM evento em uma data. Pego esses eventos, conto por data e os traço. No entanto, quando os traço, minhas duas séries nem sempre correspondem. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() No código acima, o idx se torna …
126 python  date  plot  pandas  dataframe 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.