Perguntas com a marcação «pandas»

pandas é uma biblioteca python para manipulação e análise de dados em painel, por exemplo, séries temporais multidimensionais e conjuntos de dados transversais comumente encontrados em estatísticas, resultados de ciências experimentais, econometria ou finanças.

3

2
Quando escolher a regressão linear ou a Árvore de Decisão ou a Floresta Aleatória? [fechadas]
Fechado . Esta questão precisa ser mais focada . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela se concentre apenas em um problema editando esta postagem . Fechado há 4 anos . Estou trabalhando em um projeto e estou tendo dificuldades para …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 


1
Diferença entre interpolar () e fillna () em pandas
Como o método interpolar e fillna faz o mesmo trabalho de preencher um valor. Qual é a diferença básica entre os dois. Qual é o significado de ter esses dois métodos diferentes? Alguém pode me explicar em termos leigos. Eu já visitei a documentação oficial e queria saber a diferença



2
Contando índices em pandas
Sinto que essa é uma pergunta rudimentar, mas sou muito nova nisso e simplesmente não consegui decifrá-la / encontrar a resposta. Em última análise, o que estou tentando fazer aqui é contar valores exclusivos em uma determinada coluna e determinar quais desses valores únicos têm mais de um valor exclusivo …


2
Usando o TF-IDF com outros recursos no SKLearn
Qual é a melhor / maneira correta de combinar a análise de texto com outros recursos? Por exemplo, eu tenho um conjunto de dados com algum texto, mas também outros recursos / categorias. O vetorizador TF-IDF do SKlearn transforma dados de texto em matrizes esparsas. Eu posso usar essas matrizes …

1
Estou fazendo uma transformação de log de dados corretamente?
Estou fazendo uma análise de dados exploratória em alguns dados e recebo estes histogramas: Isso parece um candidato para uma transformação de log nos dados, então eu executo o seguinte código Python para transformar os dados: df["abv"].apply(np.log).hist() df["ibu"].apply(np.log).hist() plt.show() E eu recebo este novo gráfico dos histogramas transformados: Estou certo …

4
Pandas: como criar colunas de vários níveis
Eu tenho um DataFrame de pandas que possui as seguintes colunas: n_0 n_1 p_0 p_1 e_0 e_1 Eu quero transformá-lo para ter colunas e sub-colunas: 0 n p e 1 n p e Eu procurei na documentação e estou completamente perdido em como implementar isso. Alguém tem alguma sugestão?
8 pandas 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.