Perguntas com a marcação «dataframe»

Um quadro de dados é uma estrutura de dados tabular. Geralmente, ele contém dados em que linhas são observações e colunas são variáveis ​​de vários tipos. Enquanto "quadro de dados" ou "quadro de dados" é o termo usado para esse conceito em várias línguas (R, Apache Spark, deedle, Maple, a biblioteca de pandas em Python e a biblioteca de DataFrames em Julia), "tabela" é o termo usado em MATLAB e SQL.





3
Operadores lógicos para indexação booleana no Pandas
Estou trabalhando com índice booleano no Pandas. A questão é por que a afirmação: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] funciona bem enquanto a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] sai com erro? Exemplo: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more …

6
Devo usar um data.frame ou uma matriz?
Quando alguém deve usar a data.framee quando é melhor usar a matrix? Ambos mantêm os dados em um formato retangular, portanto, às vezes, não está claro. Existem regras gerais para quando usar qual tipo de dados?
152 r  matrix  dataframe  r-faq 


8
Os pandas podem reconhecer datas automaticamente?
Hoje, fiquei positivamente surpreso pelo fato de que, ao ler dados de um arquivo de dados (por exemplo), o pandas é capaz de reconhecer tipos de valores: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Por exemplo, pode ser verificado desta maneira: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) Em particular …
151 python  date  types  dataframe  pandas 

3
Pandas criam DataFrame vazio com apenas nomes de colunas
Eu tenho um DataFrame dinâmico que funciona bem, mas quando não há dados a serem adicionados ao DataFrame, recebo um erro. E, portanto, preciso de uma solução para criar um DataFrame vazio com apenas os nomes das colunas. Por enquanto, tenho algo parecido com isto: df = pd.DataFrame(columns=COLUMN_NAMES) # Note …
151 python  pandas  dataframe 





7
Converter nomes de linhas na primeira coluna
Eu tenho um quadro de dados como este: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" Quero converter os nomes das linhas na primeira coluna. Atualmente, uso algo assim …
147 r  dataframe  col  rowname 


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.