Primeiro, acabei de criar uma expressão regular que corresponderá a todos os caminhos de biblioteca externa exclusivos em uma lista de todos os arquivos de cabeçalho em um projeto. Eu fiz uma pergunta sobre como fazer essa regexp uma semana atrás.
Comecei a me intrometer para ver como ele se comportaria quando fosse assíncrono e quando se transformasse em um web worker. Por conveniência e confiabilidade, criei este arquivo universal que é executado em todos os três modos:
/** Will call result() callback with every match it founds. Asynchronous unless called
* with interval = -1.
* Javadoc style comment for Arnold Rimmer and other Java programmers:
*
* @param regex regular expression to match in string
* @param string guess what
* @param result callback function that accepts one parameter, string match
* @param done callback on finish, has no parameters
* @param interval delay (not actual interval) between finding matches. If -1,
* function will be blocking
* @property working false if loop isn't running, otherwise contains timeout ID
* for use with clearTimeout
* @property done copy of done parameter
* @throws heavy boulders
**/
function processRegex(regex, string, result, done, interval) {
var m;
//Please tell me interpreter optimizes this
interval = typeof interval!='number'?1:interval;
//And this
processRegex.done = done;
while ((m = regex.exec(string))) {
Array.prototype.splice.call(m,0,1);
var path = m.join("");
//It's good to keep in mind that result() slows down the process
result(path);
if (interval>=0) {
processRegex.working = setTimeout(processRegex,
interval, regex, string,
result, done, interval);
// Comment these out for maximum speed
processRegex.progress = regex.lastIndex/string.length;
console.log("Progress: "+Math.round(processRegex.progress*100)+"%");
return;
}
}
processRegex.working = false;
processRegex.done = null;
if (typeof done=="function")
done();
}
processRegex.working = false;
Eu criei um arquivo de teste, ao invés de colá-lo aqui, eu o carreguei em uma hospedagem web muito confiável: Demo - Dados de teste .
O que acho muito surpreendente é que haja uma diferença tão significativa entre o trabalhador da web e a execução do navegador do RegExp. Os resultados que obtive:
- Mozilla Firefox
[WORKER]: Time elapsed:16.860s
[WORKER-SYNC]: Time elapsed:16.739s
[TIMEOUT]: Time elapsed:5.186s
[LOOP]: Time elapsed:5.028s
Você também pode ver que, com minha expressão regular específica, a diferença entre um loop síncrono e um assíncrono é insignificante. Tentei usar uma lista de correspondências em vez de uma expressão antecipada e os resultados mudaram muito. Aqui estão as alterações na função antiga:
function processRegexUnique(regex, string, result, done, interval) {
var matchList = arguments[5]||[];
... same as before ...
while ((m = regex.exec(string))) {
... same as before ...
if (matchList.indexOf(path)==-1) {
result(path);
matchList.push(path);
}
if (interval>=0) {
processRegex.working = setTimeout(processRegex, interval,
regex, string, result,
done, interval, matchList);
... same as before ...
}
}
... same as before ...
}
E os resultados:
- Mozilla Firefox
[WORKER]: Time elapsed:0.062s
[WORKER-SYNC]: Time elapsed:0.023s
[TIMEOUT]: Time elapsed:12.250s
(nota para mim mesmo: está ficando mais estranho a cada minuto)[LOOP]: Time elapsed:0.006s
Alguém pode explicar essa diferença de velocidade?