Duvido muito que a data de publicação de uma postagem ou artigo seja baseada na <lastmod>
entrada de um sitemap XML (como outros sugeriram) ou no cabeçalho HTTP da última modificação nesse assunto. Um Sitemap XML é apenas consultivo, não autoritativo. A data da última modificação de um documento provavelmente não é a mesma que a data de publicação (original) de um artigo. E, como mencionei no meu comentário na parte superior da página, a data da última modificação de um documento é provavelmente mais importante para armazenar em cache e talvez determinar as taxas de rastreamento. O cabeçalho HTTP da última modificação de páginas geradas dinamicamente geralmente está muito próximo da data / hora real (como é o caso dos blogs do WordPress).
Um feed RSS / Atom, por outro lado, contém essa pepita específica de informações. E, de fato, em sites Wordpress que não incluem a data de publicação no conteúdo, a data de publicação ainda aparece nos resultados de pesquisa do Google. E até onde eu sei, isso corresponde à data no feed RSS.
EDIT # 1: No entanto, um feed RSS não contém necessariamente todas as páginas. Na maioria dos casos, deve conter apenas as páginas atualizadas mais recentes ou mais recentes. Mas não há razão para o Google esquecer o que já leu, e o fornecimento do conteúdo dessa página não mudou, nem a data da última modificação.
Se não houver feed RSS, acho que o Google é inteligente o suficiente para analisar o conteúdo da página. Especialmente se as datas forem marcadas 'semanticamente' com a ajuda de microformatos . É perfeitamente possível que o Google veja o seguinte como a data de publicação oficial para um artigo em que ele está contido:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
O Google certamente lê microformatos - hCard, hReview etc.
Só para acrescentar, não acho que o Google indique uma data de publicação, a menos que seja capaz de encontrar algo autoritário que sugira isso. Ele não deduzirá uma 'data de publicação' em dados especulativos, já que uma 'data de publicação' incorreta não é útil para ninguém e o Google terá muito empenho por isso!
E só para constar (se @Tom estiver sugerindo o contrário :) Acho que as postagens / artigos devem ter a data de publicação visível. Muitos não, e isso pode ser frustrante para o leitor, principalmente ao pesquisar questões de tecnologia e você acha que depois de ler a meio do artigo está desatualizado!
EDIÇÃO # 2: Desde então, experimentei um aborrecimento semelhante que os detalhes de @mmdanziger em sua resposta. Em um dos meus sites antigos, tenho o texto "Última atualização do site dom 17 de junho de 2012" (não marcado de nenhuma maneira especial) na parte superior de todas as páginas (gravadas na página com JavaScript !!). Essa mesma data foi escolhida pelo Google e agora aparece ao lado de várias páginas (mas não todas) que aparecem no SERPS - essa certamente não é a data de publicação da página. Parece que o Google está simplesmente descartando a página em busca de uma sequência do formulário "última atualização ( cadeia de dados )" (tendo processado o JavaScript !!). Este site em particular não possui um feed RSS. O site possui um arquivo Sitemap.xml, mas as datas são diferentes.
Percebi um comportamento semelhante em outros sites também.