Stroustrup publicou recentemente uma série de posts desmistificando mitos populares sobre C ++ . O quinto mito é: "C ++ é somente para programas grandes e complicados". Para desmascará-lo, ele escreveu um programa C ++ simples, baixando uma página da Web e extraindo links dela . Aqui está:
#include <string>
#include <set>
#include <iostream>
#include <sstream>
#include <regex>
#include <boost/asio.hpp>
using namespace std;
set<string> get_strings(istream& is, regex pat)
{
set<string> res;
smatch m;
for (string s; getline(is, s);) // read a line
if (regex_search(s, m, pat))
res.insert(m[0]); // save match in set
return res;
}
void connect_to_file(iostream& s, const string& server, const string& file)
// open a connection to server and open an attach file to s
// skip headers
{
if (!s)
throw runtime_error{ "can't connect\n" };
// Request to read the file from the server:
s << "GET " << "http://" + server + "/" + file << " HTTP/1.0\r\n";
s << "Host: " << server << "\r\n";
s << "Accept: */*\r\n";
s << "Connection: close\r\n\r\n";
// Check that the response is OK:
string http_version;
unsigned int status_code;
s >> http_version >> status_code;
string status_message;
getline(s, status_message);
if (!s || http_version.substr(0, 5) != "HTTP/")
throw runtime_error{ "Invalid response\n" };
if (status_code != 200)
throw runtime_error{ "Response returned with status code" };
// Discard the response headers, which are terminated by a blank line:
string header;
while (getline(s, header) && header != "\r")
;
}
int main()
{
try {
string server = "www.stroustrup.com";
boost::asio::ip::tcp::iostream s{ server, "http" }; // make a connection
connect_to_file(s, server, "C++.html"); // check and open file
regex pat{ R"((http://)?www([./#\+-]\w*)+)" }; // URL
for (auto x : get_strings(s, pat)) // look for URLs
cout << x << '\n';
}
catch (std::exception& e) {
std::cout << "Exception: " << e.what() << "\n";
return 1;
}
}
Vamos mostrar ao Stroustrup o que é um programa pequeno e legível .
- Baixar
http://www.stroustrup.com/C++.html
Listar todos os links:
http://www-h.eng.cam.ac.uk/help/tpl/languages/C++.html http://www.accu.org http://www.artima.co/cppsource http://www.boost.org ...
Você pode usar qualquer idioma, mas nenhuma biblioteca de terceiros é permitida.
Vencedora
A resposta C ++ ganhou por votos, mas depende de uma biblioteca de terceiros (o que não é permitido por regras) e, junto com outro concorrente próximo Bash , conta com um cliente HTTP invadido (que não funcionará com HTTPS, gzip, redireciona etc.). Então Wolfram é um vencedor claro. Outra solução que se aproxima em termos de tamanho e legibilidade é o PowerShell (com melhorias nos comentários), mas não recebeu muita atenção. Linguagens mainstream ( Python , C # ) também chegaram bem perto.
Content-Type: text/html; charset=UTF-8
... vou enviar um e-mail para ele.
boost/asio
é usado lá em cima, que é uma biblioteca de terceiros. Quero dizer, como os idiomas que não incluem a busca de url / tcp como parte de sua biblioteca padrão competem?