Abordagem ingênua
def transpose_finite_iterable(iterable):
return zip(*iterable) # `itertools.izip` for Python 2 users
funciona bem para iterável finito (por exemplo, seqüências como list
/ tuple
/ str
) de iteráveis (potencialmente infinitos) que podem ser ilustrados como
| |a_00| |a_10| ... |a_n0| |
| |a_01| |a_11| ... |a_n1| |
| |... | |... | ... |... | |
| |a_0i| |a_1i| ... |a_ni| |
| |... | |... | ... |... | |
Onde
n in ℕ
,
a_ij
corresponde ao j
-th elemento de i
-th iterável,
e depois de aplicar transpose_finite_iterable
chegamos
| |a_00| |a_01| ... |a_0i| ... |
| |a_10| |a_11| ... |a_1i| ... |
| |... | |... | ... |... | ... |
| |a_n0| |a_n1| ... |a_ni| ... |
Exemplo em Python desse caso em que a_ij == j
,n == 2
>>> from itertools import count
>>> iterable = [count(), count()]
>>> result = transpose_finite_iterable(iterable)
>>> next(result)
(0, 0)
>>> next(result)
(1, 1)
Mas não podemos usar transpose_finite_iterable
novamente para retornar à estrutura do original, iterable
porque result
é um iterável infinito de iteráveis finitos ( tuple
s no nosso caso):
>>> transpose_finite_iterable(result)
... hangs ...
Traceback (most recent call last):
File "...", line 1, in ...
File "...", line 2, in transpose_finite_iterable
MemoryError
Então, como podemos lidar com este caso?
... e aqui vem o deque
Depois de examinarmos os documentos de itertools.tee
função , há uma receita Python que, com algumas modificações, pode ajudar no nosso caso
def transpose_finite_iterables(iterable):
iterator = iter(iterable)
try:
first_elements = next(iterator)
except StopIteration:
return ()
queues = [deque([element])
for element in first_elements]
def coordinate(queue):
while True:
if not queue:
try:
elements = next(iterator)
except StopIteration:
return
for sub_queue, element in zip(queues, elements):
sub_queue.append(element)
yield queue.popleft()
return tuple(map(coordinate, queues))
vamos checar
>>> from itertools import count
>>> iterable = [count(), count()]
>>> result = transpose_finite_iterables(transpose_finite_iterable(iterable))
>>> result
(<generator object transpose_finite_iterables.<locals>.coordinate at ...>, <generator object transpose_finite_iterables.<locals>.coordinate at ...>)
>>> next(result[0])
0
>>> next(result[0])
1
Síntese
Agora podemos definir a função geral para trabalhar com iteráveis de iteráveis, das quais são finitas e outras são potencialmente infinitas usando functools.singledispatch
decorador como
from collections import (abc,
deque)
from functools import singledispatch
@singledispatch
def transpose(object_):
"""
Transposes given object.
"""
raise TypeError('Unsupported object type: {type}.'
.format(type=type))
@transpose.register(abc.Iterable)
def transpose_finite_iterables(object_):
"""
Transposes given iterable of finite iterables.
"""
iterator = iter(object_)
try:
first_elements = next(iterator)
except StopIteration:
return ()
queues = [deque([element])
for element in first_elements]
def coordinate(queue):
while True:
if not queue:
try:
elements = next(iterator)
except StopIteration:
return
for sub_queue, element in zip(queues, elements):
sub_queue.append(element)
yield queue.popleft()
return tuple(map(coordinate, queues))
def transpose_finite_iterable(object_):
"""
Transposes given finite iterable of iterables.
"""
yield from zip(*object_)
try:
transpose.register(abc.Collection, transpose_finite_iterable)
except AttributeError:
# Python3.5-
transpose.register(abc.Mapping, transpose_finite_iterable)
transpose.register(abc.Sequence, transpose_finite_iterable)
transpose.register(abc.Set, transpose_finite_iterable)
que pode ser considerado como seu próprio inverso (os matemáticos chamam esse tipo de função de "involuções" ) na classe de operadores binários sobre iteráveis finitos e não vazios.
Como bônus de singledispatch
ing, podemos lidar com numpy
matrizes como
import numpy as np
...
transpose.register(np.ndarray, np.transpose)
e depois usá-lo como
>>> array = np.arange(4).reshape((2,2))
>>> array
array([[0, 1],
[2, 3]])
>>> transpose(array)
array([[0, 2],
[1, 3]])
Nota
Desde que transpose
retorna iteradores e se alguém quiser ter um tuple
de list
s como no OP - isso pode ser feito adicionalmente com map
a função incorporada como
>>> original = [('a', 1), ('b', 2), ('c', 3), ('d', 4)]
>>> tuple(map(list, transpose(original)))
(['a', 'b', 'c', 'd'], [1, 2, 3, 4])
Propaganda
Eu adicionei uma solução generalizada ao lz
pacote da 0.5.0
versão que pode ser usada como
>>> from lz.transposition import transpose
>>> list(map(tuple, transpose(zip(range(10), range(10, 20)))))
[(0, 1, 2, 3, 4, 5, 6, 7, 8, 9), (10, 11, 12, 13, 14, 15, 16, 17, 18, 19)]
PS
Não há solução (pelo menos óbvia) para lidar com iterável potencialmente infinito de iteráveis potencialmente infinitos, mas esse caso é menos comum.