A seguir, é mais lento que as abordagens cronometradas aqui , mas podemos calcular a coluna extra com base no conteúdo de mais de uma coluna e mais de dois valores podem ser calculados para a coluna extra.
Exemplo simples usando apenas a coluna "Set":
def set_color(row):
if row["Set"] == "Z":
return "red"
else:
return "green"
df = df.assign(color=df.apply(set_color, axis=1))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C green
Exemplo com mais cores e mais colunas consideradas:
def set_color(row):
if row["Set"] == "Z":
return "red"
elif row["Type"] == "C":
return "blue"
else:
return "green"
df = df.assign(color=df.apply(set_color, axis=1))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C blue
Editar (21/06/2019): Usando plydata
Também é possível usar plydata para fazer esse tipo de coisa (isso parece ainda mais lento do que usar assign
e apply
, no entanto).
from plydata import define, if_else
Simples if_else
:
df = define(df, color=if_else('Set=="Z"', '"red"', '"green"'))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C green
Aninhado if_else
:
df = define(df, color=if_else(
'Set=="Z"',
'"red"',
if_else('Type=="C"', '"green"', '"blue"')))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B blue
3 Y C green