Perguntas com a marcação «dataframe»

Um quadro de dados é uma estrutura de dados tabular. Geralmente, ele contém dados em que linhas são observações e colunas são variáveis ​​de vários tipos. Enquanto "quadro de dados" ou "quadro de dados" é o termo usado para esse conceito em várias línguas (R, Apache Spark, deedle, Maple, a biblioteca de pandas em Python e a biblioteca de DataFrames em Julia), "tabela" é o termo usado em MATLAB e SQL.

5
Desempilhar e retornar o valor conta para cada variável?
Eu tenho um quadro de dados que registra respostas da escolha de 19717 pessoas das linguagens de programação por meio de perguntas de múltipla escolha. A primeira coluna é, obviamente, o sexo do entrevistado, enquanto o restante são as escolhas que eles escolheram. E, portanto, se eu escolher o Python, …


3
Obtenha a distância mais próxima com dois geodataframe nos pandas
Aqui está meu primeiro geodatframe: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) Cidade1 …



3
Pandas lentos DataFrame MultiIndex reindex
Eu tenho um DataFrame de pandas do formulário: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 …

1
Como dinamizar coluna de quadro de dados consistindo com seção e subseção Em R
Eu tenho um dataframe mencionado abaixo: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", …

2
Gerar produtos cartesianos binários filtrados
Declaração do problema Estou procurando uma maneira eficiente de gerar produtos cartesianos binários completos (tabelas com todas as combinações de True e False com um certo número de colunas), filtradas por determinadas condições exclusivas. Por exemplo, para três colunas / bits n=3obteríamos a tabela completa df_combs = pd.DataFrame(itertools.product(*([[True, False]] * …



6
identificar e marcar linhas duplicadas em r
Gostaria de identificar e marcar linhas duplicadas com base em 2 colunas. Gostaria de criar um identificador exclusivo para cada duplicata, para que eu saiba não apenas que a linha é uma duplicata, mas com qual linha é uma duplicata. Eu tenho um quadro de dados que se parece com …
11 r  dataframe 


6
mesclar quadros de dados com base em várias colunas e limites
Eu tenho dois data.frames com várias colunas comuns (aqui: date, city, ctry, e ( other_) number). Gostaria agora de mesclá-los nas colunas acima, mas tolero algum nível de diferença: threshold.numbers <- 3 threshold.date <- 5 # in days Se a diferença entre as dateentradas for > threshold.date(em dias) ou > …
11 r  dataframe 



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.