O que você tem são dados de tempo até o evento, que também são denominados análise de sobrevivência. Essa não é realmente a minha área, por isso não estou dando uma resposta detalhada aqui. Pesquisando no Google para "dados de tempo de eventos" ou "análise de sobrevivência", você terá muitos hits!
Um bom ponto de partida poderia ser o capítulo (13) sobre a análise de sobrevivência em Venables / Ripley: MASS, ou o clássico "A análise estatística de dados de tempo de falha, segunda edição", de John D. Kalbfleisch, Ross L. Prentice (aut.)
EDITAR, RESPOSTA ESTENDIDA
Como alternativa à análise de sobrevivência, você pode aproximar isso por regressão logística ordinal. Por exemplo, no seu caso de exemplo da primeira data de congelamento, defina algumas datas para as quais você atribui o estado "estiver congelando no ou antes", 0 (sem congelamento), 1 (congelamento). Que acomoda muito bem os anos sem congelar, você simplesmente tem um vetor de resposta zero. Se as datas escolhidas forem, digamos,
1:08 15:08 1:09 15:09 1:10 15:10 1:11 15:11 1:12 15:12 1:01 15:01
and the actual date of first freezing was 17:11, then your observed vector will be
0 0 0 0 0 0 0 0 1 1 1 1
e, em geral, todos os vetores de resposta terão um bloco inicial de zeros, seguido por um bloco de zeros. Em seguida, você pode usar isso com regressão logística ordinal, obtendo uma probabilidade estimada de congelamento para cada data. Traçar essa curva fornecerá uma aproximação para uma curva de sobrevivência (a sobrevivência, nesse contexto, torna-se "ainda não congelada").
EDIT
Também é possível ver seus dados como eventos recorrentes, já que o rio congela (quase) todos os anos. Veja minha resposta aqui: Encontrando preditores significativos de readmissões psiquiátricas