Eu estou tentando enumerar uma grande IEnumerable
uma vez, e observar a enumeração com vários operadores ligados ( Count
, Sum
, Average
etc). A maneira óbvia é transformá-lo em um IObservable
com o método ToObservable
e, em seguida, inscrever um observador nele. Notei que isso é muito mais lento que outros métodos, como fazer um loop simples e notificar o observador em cada iteração ou usar o Observable.Create
método em vez de ToObservable
. A diferença é substancial: é 20 a 30 vezes mais lenta. É o que é, ou estou fazendo algo errado?
using System;
using System.Diagnostics;
using System.Linq;
using System.Reactive.Disposables;
using System.Reactive.Linq;
using System.Reactive.Subjects;
using System.Reactive.Threading.Tasks;
public static class Program
{
static void Main(string[] args)
{
const int COUNT = 10_000_000;
Method1(COUNT);
Method2(COUNT);
Method3(COUNT);
}
static void Method1(int count)
{
var source = Enumerable.Range(0, count);
var subject = new Subject<int>();
var stopwatch = Stopwatch.StartNew();
source.ToObservable().Subscribe(subject);
Console.WriteLine($"ToObservable: {stopwatch.ElapsedMilliseconds:#,0} msec");
}
static void Method2(int count)
{
var source = Enumerable.Range(0, count);
var subject = new Subject<int>();
var stopwatch = Stopwatch.StartNew();
foreach (var item in source) subject.OnNext(item);
subject.OnCompleted();
Console.WriteLine($"Loop & Notify: {stopwatch.ElapsedMilliseconds:#,0} msec");
}
static void Method3(int count)
{
var source = Enumerable.Range(0, count);
var subject = new Subject<int>();
var stopwatch = Stopwatch.StartNew();
Observable.Create<int>(o =>
{
foreach (var item in source) o.OnNext(item);
o.OnCompleted();
return Disposable.Empty;
}).Subscribe(subject);
Console.WriteLine($"Observable.Create: {stopwatch.ElapsedMilliseconds:#,0} msec");
}
}
Resultado:
ToObservable: 7,576 msec
Loop & Notify: 273 msec
Observable.Create: 511 msec
.NET Core 3.0, C # 8, System.Reactive 4.3.2, Windows 10, Aplicativo de console, Versão compilada
Atualização: Aqui está um exemplo da funcionalidade real que desejo obter:
var source = Enumerable.Range(0, 10_000_000).Select(i => (long)i);
var subject = new Subject<long>();
var cntTask = subject.Count().ToTask();
var sumTask = subject.Sum().ToTask();
var avgTask = subject.Average().ToTask();
source.ToObservable().Subscribe(subject);
Console.WriteLine($"Count: {cntTask.Result:#,0}, Sum: {sumTask.Result:#,0}, Average: {avgTask.Result:#,0.0}");
Resultado:
Contagem: 10.000.000, Soma: 49.999.995.000.000, Média: 4.999.999,5
A diferença importante dessa abordagem em comparação ao uso de operadores LINQ padrão é que o enumerável de origem é enumerado apenas uma vez.
Mais uma observação: o uso ToObservable(Scheduler.Immediate)
é um pouco mais rápido (cerca de 20%) do que ToObservable()
.