Este é um exercício acadêmico ou você pretende usar a linguagem assembly que aprende? Isso é coisa bastante especializada hoje em dia. A otimização do compilador tornou-se tão boa que mesmo algo como uma unidade de disco rígido de alto desempenho normalmente teria cerca de 1% de sua base de código escrita no assembler. Indo pela cadeia alimentar até os processadores de 4 bits ou 8 bits, você verá muito mais a linguagem assembly sendo usada.
Se você realmente deseja experimentar a linguagem assembly, escolha um processador que tenha um bom conjunto de instruções. Como sou um ex-funcionário da ARM, provavelmente sou tendencioso, mas achei que o conjunto de instruções do ARM era particularmente fácil de aprender - fui capaz de escrever um filtro FIR eficiente no mesmo dia no terceiro dia na empresa. Os parceiros de semicondutores da ARM estão vendendo cerca de um bilhão de núcleos ARM por trimestre hoje em dia, por isso é muito fácil encontrar uma empresa que esteja disposta a usar sua experiência em ARM ASM.
Existem muitas placas de avaliação do ARM disponíveis por cerca de US $ 50 para testar seu código - parece que o ARM Cortex M3 será imensamente popular. Ele usa o conjunto de instruções Thumb2 do ARM, que é um pouco mais obscuro do que o simples código ARM32, mas ainda é bastante fácil e muito poderoso.
Este pequeno painel parece muito legal, por 80 euros: http://www.olimex.com/dev/stm32-103stk.html