Para selecionar a ith
linha, useiloc
:
In [31]: df_test.iloc[0]
Out[31]:
ATime 1.2
X 2.0
Y 15.0
Z 2.0
Btime 1.2
C 12.0
D 25.0
E 12.0
Name: 0, dtype: float64
Para selecionar o i-ésimo valor na Btime
coluna, você pode usar:
In [30]: df_test['Btime'].iloc[0]
Out[30]: 1.2
Há uma diferença entre df_test['Btime'].iloc[0]
(recomendado) e df_test.iloc[0]['Btime']
:
Os DataFrames armazenam dados em blocos baseados em colunas (onde cada bloco tem um único tipo). Se você selecionar primeiro a coluna, uma exibição poderá ser retornada (o que é mais rápido que o retorno de uma cópia) e o dtype original é preservado. Por outro lado, se você selecionar primeiro a linha e se o DataFrame tiver colunas de diferentes tipos, o Pandas copiará os dados em uma nova série de tipos de objetos. Portanto, selecionar colunas é um pouco mais rápido que selecionar linhas. Assim, embora
df_test.iloc[0]['Btime']
funcione, df_test['Btime'].iloc[0]
é um pouco mais eficiente.
Há uma grande diferença entre os dois quando se trata de atribuição.
df_test['Btime'].iloc[0] = x
afeta df_test
, mas df_test.iloc[0]['Btime']
pode não. Veja abaixo uma explicação do porquê. Como uma diferença sutil na ordem da indexação faz uma grande diferença no comportamento, é melhor usar a atribuição de indexação única:
df.iloc[0, df.columns.get_loc('Btime')] = x
df.iloc[0, df.columns.get_loc('Btime')] = x
(recomendado):
A maneira recomendada de atribuir novos valores a um DataFrame é evitar a indexação em cadeia e, em vez disso, use o método mostrado por andrew ,
df.loc[df.index[n], 'Btime'] = x
ou
df.iloc[n, df.columns.get_loc('Btime')] = x
O último método é um pouco mais rápido, porque df.loc
é necessário converter os rótulos de linha e coluna em índices posicionais; portanto, é necessário um pouco menos de conversão se você usar
df.iloc
.
df['Btime'].iloc[0] = x
funciona, mas não é recomendado:
Embora isso funcione, ele está aproveitando a maneira como os DataFrames são implementados atualmente . Não há garantia de que o Pandas funcione dessa maneira no futuro. Em particular, está aproveitando o fato de que (atualmente) df['Btime']
sempre retorna uma visualização (não uma cópia), para que df['Btime'].iloc[n] = x
possa ser usado para atribuir um novo valor no enésimo local da Btime
coluna de df
.
Como o Pandas não oferece garantias explícitas sobre quando os indexadores retornam uma visualização versus uma cópia, as atribuições que usam indexação encadeada geralmente sempre aumentam SettingWithCopyWarning
, embora nesse caso a atribuição consiga modificar df
:
In [22]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])
In [24]: df['bar'] = 100
In [25]: df['bar'].iloc[0] = 99
/home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
self._setitem_with_indexer(indexer, value)
In [26]: df
Out[26]:
foo bar
0 A 99 <-- assignment succeeded
2 B 100
1 C 100
df.iloc[0]['Btime'] = x
não funciona:
Por outro lado, a atribuição com df.iloc[0]['bar'] = 123
não funciona porque df.iloc[0]
está retornando uma cópia:
In [66]: df.iloc[0]['bar'] = 123
/home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
In [67]: df
Out[67]:
foo bar
0 A 99 <-- assignment failed
2 B 100
1 C 100
Aviso : eu havia sugerido anteriormente df_test.ix[i, 'Btime']
. Mas isso não garante que você ofereça o ith
valor, pois ix
tenta indexar por rótulo antes de tentar indexar por posição . Portanto, se o DataFrame tiver um índice inteiro que não esteja na ordem classificada, começando em 0, usar ix[i]
retornará a linha rotulada i
em vez da ith
linha. Por exemplo,
In [1]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])
In [2]: df
Out[2]:
foo
0 A
2 B
1 C
In [4]: df.ix[1, 'foo']
Out[4]: 'C'
df_test.head(1)
iria trabalhar, a forma mais geral é a utilizaçãoiloc
como respondidas por unutbu