Java (n = 8)
import java.util.*;
import java.util.concurrent.*;
public class HankelCombinatorics {
public static final int NUM_THREADS = 8;
private static final int[] FACT = new int[13];
static {
FACT[0] = 1;
for (int i = 1; i < FACT.length; i++) FACT[i] = i * FACT[i-1];
}
public static void main(String[] args) {
long prevElapsed = 0, start = System.nanoTime();
for (int i = 1; i < 12; i++) {
long count = count(i), elapsed = System.nanoTime() - start;
System.out.format("%d in %dms, total elapsed %dms\n", count, (elapsed - prevElapsed) / 1000000, elapsed / 1000000);
prevElapsed = elapsed;
}
}
@SuppressWarnings("unchecked")
private static long count(int n) {
int[][] perms = new int[FACT[n]][];
genPermsInner(0, 0, new int[n], perms, 0);
// We partition by canonical representation of the row sum multiset, discarding any with a density > 50%.
Map<CanonicalMatrix, Map<CanonicalMatrix, Integer>> part = new HashMap<CanonicalMatrix, Map<CanonicalMatrix, Integer>>();
for (int m = 0; m < 1 << (2*n-1); m++) {
int density = 0;
int[] key = new int[n];
for (int i = 0; i < n; i++) {
key[i] = Integer.bitCount((m >> i) & ((1 << n) - 1));
density += key[i];
}
if (2 * density <= n * n) {
CanonicalMatrix _key = new CanonicalMatrix(key);
Map<CanonicalMatrix, Integer> map = part.get(_key);
if (map == null) part.put(_key, map = new HashMap<CanonicalMatrix, Integer>());
map.put(new CanonicalMatrix(m, perms[0]), m);
}
}
List<Job> jobs = new ArrayList<Job>();
ExecutorService pool = Executors.newFixedThreadPool(NUM_THREADS);
for (Map.Entry<CanonicalMatrix, Map<CanonicalMatrix, Integer>> e : part.entrySet()) {
Job job = new Job(n, perms, e.getKey().sum() << 1 == n * n ? 0 : 1, e.getValue());
jobs.add(job);
pool.execute(job);
}
pool.shutdown();
try {
pool.awaitTermination(1, TimeUnit.DAYS); // i.e. until it's finished - inaccurate results are useless
}
catch (InterruptedException ie) {
throw new IllegalStateException(ie);
}
long total = 0;
for (Job job : jobs) total += job.subtotal;
return total;
}
private static int genPermsInner(int idx, int usedMask, int[] a, int[][] perms, int off) {
if (idx == a.length) perms[off++] = a.clone();
else for (int i = 0; i < a.length; i++) {
int m = 1 << (a[idx] = i);
if ((usedMask & m) == 0) off = genPermsInner(idx+1, usedMask | m, a, perms, off);
}
return off;
}
static class Job implements Runnable {
private volatile long subtotal = 0;
private final int n;
private final int[][] perms;
private final int shift;
private final Map<CanonicalMatrix, Integer> unseen;
public Job(int n, int[][] perms, int shift, Map<CanonicalMatrix, Integer> unseen) {
this.n = n;
this.perms = perms;
this.shift = shift;
this.unseen = unseen;
}
public void run() {
long result = 0;
int[][] perms = this.perms;
Map<CanonicalMatrix, Integer> unseen = this.unseen;
while (!unseen.isEmpty()) {
int m = unseen.values().iterator().next();
Set<CanonicalMatrix> equiv = new HashSet<CanonicalMatrix>();
for (int[] perm : perms) {
CanonicalMatrix canonical = new CanonicalMatrix(m, perm);
if (equiv.add(canonical)) {
result += canonical.weight() << shift;
unseen.remove(canonical);
}
}
}
subtotal = result;
}
}
static class CanonicalMatrix {
private final int[] a;
private final int hash;
public CanonicalMatrix(int m, int[] r) {
this(permuteRows(m, r));
}
public CanonicalMatrix(int[] a) {
this.a = a;
Arrays.sort(a);
int h = 0;
for (int i : a) h = h * 37 + i;
hash = h;
}
private static int[] permuteRows(int m, int[] perm) {
int[] cols = new int[perm.length];
for (int i = 0; i < perm.length; i++) {
for (int j = 0; j < cols.length; j++) cols[j] |= ((m >> (perm[i] + j)) & 1L) << i;
}
return cols;
}
public int sum() {
int sum = 0;
for (int i : a) sum += i;
return sum;
}
public int weight() {
int prev = -1, count = 0, weight = FACT[a.length];
for (int col : a) {
if (col == prev) weight /= ++count;
else {
prev = col;
count = 1;
}
}
return weight;
}
@Override public boolean equals(Object obj) {
// Deliberately unsuitable for general-purpose use, but helps catch bugs faster.
CanonicalMatrix that = (CanonicalMatrix)obj;
for (int i = 0; i < a.length; i++) {
if (a[i] != that.a[i]) return false;
}
return true;
}
@Override public int hashCode() {
return hash;
}
}
}
Salvar como HankelCombinatorics.java
, compilar como javac HankelCombinatorics.java
, executar como java -Xmx2G HankelCombinatorics
.
Com NUM_THREADS = 4
a minha máquina quad-core fica 20420819767436
por n=8
em 50 a 55 segundos decorridos, com uma boa quantidade de variabilidade entre as execuções; Espero que ele gerencie facilmente o mesmo em sua máquina octa-core, mas levará uma hora ou mais para obtê-lo n=9
.
Como funciona
Dado n
, existem matrizes 2^(2n-1)
binárias n
x n
Hankel. As linhas podem ser permutadas de n!
maneiras e as colunas de n!
maneiras. Tudo o que precisamos fazer é evitar a contagem dupla ...
Se você calcular a soma de cada linha, nem permutar as linhas nem permutar as colunas alterará o conjunto múltiplo de somas. Por exemplo
0 1 1 0 1
1 1 0 1 0
1 0 1 0 0
0 1 0 0 1
1 0 0 1 0
possui soma de linha multiset {3, 3, 2, 2, 2}
e, assim como todas as matrizes Hankelable derivadas dela. Isso significa que podemos agrupar as matrizes de Hankel por esses multisets de soma de linhas e manipular cada grupo independentemente, explorando vários núcleos de processador.
Há também uma simetria explorável: as matrizes com mais zeros do que aquelas estão em bijeção com as matrizes com mais zeros.
Dupla contagem ocorre quando matriz de Hankel M_1
com permutação de linha r_1
e coluna de permutação c_1
corresponde matriz de Hankel M_2
com permutação de linha r_2
e coluna de permutação c_2
(com um máximo de dois, mas não todos os três M_1 = M_2
, r_1 = r_2
, c_1 = c_2
). As linhas e colunas permutações são independentes, por isso, se nós aplicamos fila permutação r_1
para M_1
e linha de permutação r_2
para M_2
, as colunas como multisets devem ser iguais. Portanto, para cada grupo, calculo todos os conjuntos múltiplos de colunas obtidos aplicando uma permutação de linha a uma matriz no grupo. A maneira mais fácil de obter uma representação canônica dos multisets é classificar as colunas, o que também é útil na próxima etapa.
Tendo obtido os diversos conjuntos de colunas distintos, precisamos descobrir quantas n!
permutações de cada um são únicas. Nesse ponto, a contagem dupla só pode ocorrer se um determinado conjunto múltiplo de colunas tiver colunas duplicadas: o que precisamos fazer é contar o número de ocorrências de cada coluna distinta no conjunto múltiplo e calcular o coeficiente multinomial correspondente. Como as colunas são classificadas, é fácil fazer a contagem.
Finalmente, adicionamos todos eles.
A complexidade assintótica não é trivial para calcular com precisão total, porque precisamos fazer algumas suposições sobre os conjuntos. Avaliamos a ordem dos 2^(2n-2) n!
vários conjuntos de colunas, levando n^2 ln n
tempo para cada um (incluindo a classificação); se o agrupamento não leva mais que um ln n
fator, temos complexidade de tempo Theta(4^n n! n^2 ln n)
. Mas desde que os fatores exponenciais dominam completamente os polinomiais, é isso Theta(4^n n!) = Theta((4n/e)^n)
.