Lista de listas em um array numpy


183

Como converter uma lista simples de listas em uma matriz numpy? As linhas são sublistas individuais e cada linha contém os elementos na sub-lista.

Respostas:


199

Se sua lista de listas contiver listas com um número variável de elementos, a resposta de Ignacio Vazquez-Abrams não funcionará. Em vez disso, existem pelo menos três opções:

1) Faça uma matriz de matrizes:

x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>

2) Faça uma matriz de listas:

x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>

3) Primeiro faça as listas iguais em comprimento:

x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>>       [1, 2, 3],
>>>       [1, None, None]], dtype=object)

15
Obrigado, vim aqui por isso. Usam o numpy há um tempo e acharam esse comportamento não trivial. Obrigado por reservar um tempo para explicar esse caso mais geral.
Adam Hughes

dtype=floatfunciona também, ele será convertido Nonepara np.nan, o que pode ser útil.

107
>>> numpy.array([[1, 2], [3, 4]]) 
array([[1, 2], [3, 4]])

13
isso converte automaticamente uma lista de lista em uma matriz 2D porque o comprimento de todas as listas incluídas é o mesmo. Você sabe como não fazer isso: crie uma matriz de lista mesmo que todas as listas tenham o mesmo comprimento? Ou é possível converter uma matriz 2D em uma matriz 1D da série 1D (eficientemente Quero dizer, nenhum método iterativo ou material mapa python)
Juh_

7
Se isso não funcionar para você porque suas sublistas não são de tamanhos uniformes, consulte a resposta a seguir .
Nikana Reklawyks

@NikanaReklawyks Fiquei confuso depois de olhar para a resposta, mas seu comentário foi útil. Eu descobri que minha lista de listas era irregular, quando não era para ser.
Nikhil Girraj

39

Como esta é a principal pesquisa no Google para converter uma lista de listas em um array Numpy, oferecerei o seguinte, apesar da pergunta ter 4 anos:

>>> x = [[1, 2], [1, 2, 3], [1]]
>>> y = numpy.hstack(x)
>>> print(y)
[1 2 1 2 3 1]

Quando pensei em fazê-lo dessa maneira, fiquei bastante satisfeito comigo mesmo porque é muuuuito simples. No entanto, depois de cronometrar com uma lista maior de listas, é realmente mais rápido fazer isso:

>>> y = numpy.concatenate([numpy.array(i) for i in x])
>>> print(y)
[1 2 1 2 3 1]

Note que a resposta # 1 de Bastiaan não faz uma única lista contínua, por isso adicionei o concatenate.

Enfim ... Prefiro a hstackabordagem pelo seu uso elegante do Numpy.


12
embora algumas pessoas estejam procurando por isso, tenho certeza de que o OP queria um nparr multidimensional.
Nathan

1
Eu estava procurando por isso :))
Pallie

26

É tão simples quanto:

>>> lists = [[1, 2], [3, 4]]
>>> np.array(lists)
array([[1, 2],
       [3, 4]])

6

Novamente, depois de procurar o problema de converter listas aninhadas com níveis N em uma matriz N-dimensional, não encontrei nada, então aqui está o meu caminho:

import numpy as np

new_array=np.array([[[coord for coord in xk] for xk in xj] for xj in xi], ndmin=3) #this case for N=3

Observe que, se você já possui a estrutura de listas aninhadas, não precisa da [...[...[...]]]peça. Você só precisa ligar np.array, com ndmin=number-of-list-layers. (embora no meu caso eu precisasse, ndmin=number-of-list-layers-minus-1por algum motivo, criei uma camada extra - preciso investigar)
Venryx

Ah, tudo bem, o problema no meu caso é que, para a "camada de lista" mais profunda, as listas não tinham o mesmo comprimento, o que fazia np.arraycom que "envolvesse" essas listas mais profundas em vez de convertê-las em matrizes numpy.
Venryx

-2

Eu tinha uma lista de listas de igual comprimento. Mesmo assim Ignacio Vazquez-Abrams, a resposta não funcionou para mim. Eu tenho uma matriz numpy 1-D cujos elementos são listas. Se você enfrentou o mesmo problema, pode usar o método abaixo

Usar numpy.vstack

import numpy as np

np_array = np.empty((0,4), dtype='float')
for i in range(10)
     row_data = ...   # get row_data as list
     np_array = np.vstack((np_array, np.array(row_data)))

1
por que diabos você continuaria empilhando se sabia que tem 10 listas, por que não np.empty ((10, 4)) e depois preenchendo-o?
Mehdi

-4

Basta usar pandas

list(pd.DataFrame(listofstuff).melt().values)

isso funciona apenas para uma lista de listas

Se você tiver uma lista de listas, poderá tentar algo do tipo:

lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.