Perguntas com a marcação «dataframe»

Um quadro de dados é uma estrutura de dados tabular. Geralmente, ele contém dados em que linhas são observações e colunas são variáveis ​​de vários tipos. Enquanto "quadro de dados" ou "quadro de dados" é o termo usado para esse conceito em várias línguas (R, Apache Spark, deedle, Maple, a biblioteca de pandas em Python e a biblioteca de DataFrames em Julia), "tabela" é o termo usado em MATLAB e SQL.

4
tipos de data e hora em pandas read_csv
Estou lendo em um arquivo csv com várias colunas datetime. Eu precisaria definir os tipos de dados após a leitura no arquivo, mas às vezes parece ser um problema. Por exemplo: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Quando a …

4
Como formar uma coluna de tupla a partir de duas colunas no Pandas
Eu tenho um DataFrame do Pandas e quero combinar as colunas 'lat' e 'long' para formar uma tupla. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values …


12
linhas data.frame para uma lista
Eu tenho um data.frame que gostaria de converter em uma lista por linhas, o que significa que cada linha corresponderia aos seus próprios elementos de lista. Em outras palavras, eu gostaria de uma lista que contenha o data.frame com linhas. Até agora, lidei com esse problema da seguinte maneira, mas …
123 list  r  dataframe 


3
Encontre o nome da coluna que tem o valor máximo para cada linha
Tenho um DataFrame como este: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Aqui, eu quero perguntar como obter o nome da coluna …
122 python  pandas  dataframe  max 


7
Como anexar linhas a um quadro de dados R
Examinei o StackOverflow, mas não consigo encontrar uma solução específica para o meu problema, que envolve anexar linhas a um quadro de dados R. Estou inicializando um quadro de dados de 2 colunas vazio, da seguinte maneira. df = data.frame(x = numeric(), y = character()) Então, meu objetivo é percorrer …
121 r  merge  append  dataframe  rows 


14
Contar o número de linhas em cada grupo
Tenho um dataframe e gostaria de contar o número de linhas dentro de cada grupo. Eu regularmente uso a aggregatefunção para somar os dados da seguinte forma: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Agora, eu gostaria de contar observações, mas não consigo encontrar o argumento …
121 r  dataframe  aggregate  r-faq 


5
Passe um nome de coluna data.frame para uma função
Estou tentando escrever uma função para aceitar um data.frame ( x) e um columndele. A função executa alguns cálculos em xe posteriormente retorna outro data.frame. Estou preso no método de práticas recomendadas para passar o nome da coluna para a função. Os dois exemplos mínimos fun1e fun2abaixo produzem o resultado …
119 r  dataframe  r-faq 

3
Como testar se uma string contém uma das substrings em uma lista, em pandas?
Existe alguma função que seria equivalente a uma combinação de df.isin()e df[col].str.contains()? Por exemplo, digamos que eu tenha a série s = pd.Series(['cat','hat','dog','fog','pet'])e desejo encontrar todos os lugares onde scontenha qualquer um de ['og', 'at'], gostaria de obter tudo, exceto 'animal de estimação'. Eu tenho uma solução, mas é bastante …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.