Como você recupera programaticamente o número de colunas em um dataframe do pandas? Eu esperava algo como:
df.num_columns
Como você recupera programaticamente o número de colunas em um dataframe do pandas? Eu esperava algo como:
df.num_columns
Respostas:
Igual a:
import pandas as pd
df = pd.DataFrame({"pear": [1,2,3], "apple": [2,3,4], "orange": [3,4,5]})
len(df.columns)
3
df.shape
é melhor? meu palpite é que ele não chama uma função, mas apenas lê o atributo da memória?
Alternativo:
df.shape[1]
( df.shape[0]
é o número de linhas)
Se a variável que contém o quadro de dados for chamada df, então:
len(df.columns)
fornece o número de colunas.
E para quem deseja o número de linhas:
len(df.index)
Para uma tupla contendo o número de linhas e colunas:
df.shape
len(df)
lhe daria as linhas?
Isso funcionou para mim len (lista (df)).
A função df.info () fornecerá um resultado semelhante ao abaixo. Se você estiver usando o método read_csv do Pandas sem o parâmetro sep ou sep com ",".
raw_data = pd.read_csv("a1:\aa2/aaa3/data.csv")
raw_data.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5144 entries, 0 to 5143
Columns: 145 entries, R_fighter to R_age
Existem várias opções para obter o número da coluna e informações da coluna, como:
vamos verificá-las.
local_df = pd.DataFrame (np.random.randint (1,12, tamanho = (2,6)), colunas = ['a', 'b', 'c', 'd', 'e', 'f ']) 1. local_df.shape [1] -> atributo Shape retorna a tupla como (linha e colunas) (0,1).
local_df.info () -> info O método retornará informações detalhadas sobre o quadro de dados e suas colunas, tais como contagem de colunas, tipo de dados de colunas, contagem de valores não nulos, uso de memória pelo quadro de dados
len (local_df.columns) -> o atributo column retornará o objeto de índice das colunas do quadro de dados e a função len retornará o total de colunas disponíveis.
local_df.head (0) -> método head com o parâmetro 0 retornará a primeira linha de df, que na verdade nada além de cabeçalho.
Supondo que o número de colunas não seja superior a 10. Para diversão em loop: li_count = 0 para x em local_df: li_count = li_count + 1 impressão (li_count)
df.shape
dá um tuplo com (n_rows, n_columns)