Etiqueta: benchmark GDPval de OpenAI