QvQ 72B supera a o1 y ChatGPT4o
Alibaba QvQ 72B preview: supera a o1 y ChatGPT4o de Open AI. Cerramos el 2024 dejando a Grok 3 de xAI como el gran ausente
La noticia con la que cerraré el 2024: luego de que hace unos días Deepseek V3 (IA de China) superara a ChatGPT4o en matemáticas, programación, y preguntas complejas (cadenas de razonamiento) ahora nuevamente una IA de China, open source y gratuita supera no solo a ChatGPT4o, sino también al modelo más poderoso disponible a la fecha de Open AI o1 (o3-mini de Open AI aún saldrá en enero y tendrá un costo demasiado elevado, ya que costaría alrededor de $100 por respuesta) y lo más increíble es que ni siquiera es el modelo completo, solo es un demo que está en fase de “preview” lo cual nos deja con la expectativa de que las IA que provienen de China cierran el 2024 con doble broche de oro, y nos seguirán sorprendiendo aún más con sus modelos gratuitos y open source.
Deepseek V3 supera a ChatGPT4o
Tal como comentaba el 27 de diciembre de 2024, la IA China Deepseek lanzó su nuevo modelo V3 que superó a ChatGPT4o en cálculo, programación, y en preguntas complejas (cadenas de razonamiento) y lo mejor es que es gratis y open source, ya que puedes probarla en la web deespeek.com.
Modelos de razonamiento chino: Alibaba “QvQ 72B-preview” destrona a Open AI
Cuando se trata de cálculos complejos los modelos chinos de IA con capacidad de visión y “razonamiento” necesarios cálculos complejos están vienen superando a los modelos de Open AI ChatGPT4o y o1, y Alibaba no quiere quedarse atrás, ya que tal como comentaba en mi artículo “La IA de Alibaba QwQ reta a Open AI o1″ (29/11/2024 - Lee más dando clic aquí ) ya estaban esforzándose en superarlo, pero luego de los 12 días de Open AI, donde realizaron varias actualizaciones, incluyendo la disponibilidad del modelo completo de razonamiento o1, con lo cual Alibaba sabía que debía esperar a realizar un lanzamiento en el momento más adecuado, y por ello hoy cerramos el 2024 con pruebas al modelo de IA QvQ 72B-preview de Aliababa, que definitivamente rivaliza y hasta supera a todos los modelos disponibles a la fecha de Open AI, con la gran diferencia que es de prueba gratuita.
Pruebas: QvQ 72B preview vs o1 Open AI
Round 1: razonamiento matemático
Esto son tres cálculos de razonamiento matemático: que siempre les pido a los modelos avanzados de IA
- Prompt 1:
En un triángulo equilatero de lado 6 unidades, se inscribe un círculo. Calcula el área de ese círculo. - Prompt 2:
Una caja contiene 5 bolas rojas, 4 azules y 3 verdes. ¿De cuántas formas se pueden extraer tres bolas, una de cada color? - Prompt 3:
¿El número 3307 es un número primo?
Prompt 1
Prompt 2
Prompt 3
Comentarios de los resultados del round 1
Empate entre QvQ 72B preview vs Chat GPT-4o Open AI.
Importante: el plus de la IA de Alibaba es que no debes pagar ¿problemas para Open AI? Comentario adicional: Deepseek V3 también empató.
Round 2: cálculos algebráicos
Considerando que ambos modelos de razonamiento superan ya las tres preguntas básicas que siempre les realizo a los modelos de IA avanzados, entonces les puse dos problemas algebráicos para ver si alguna se equivocaba.
Resultado 1 – Chat GPT4o Open AI
Resultado 1 – QvQ 72B Preview
Resultado 2 – Open AI
Resultado 2 – QvQ 72B Preview
Comentarios del round 2:
Empate entre QvQ 72B preview vs o1 Open AI, pero nuevamente el plus de la IA de Alibaba es que no debes pagar ¿problemas para Open AI?
Comentario adicional: Deepseek V3 también empató.
Round 3: geometría
Para realizarlo, se debe considerar que se pone a prueba no solo su capacidad de razonamiento, sino su capacidad de visión al tener que “visualizar” triángulos y no solo caracteres como es el caso del round 2 (cálculos algebráicos). ¿Cómo llevarlos al límite? Con un ejercicio dibujado a mano.
Resultado 3 – Open AI
Resultado 3 – QvQ 72B Preview
Comentarios del round 3: Gana QvQ 72B preview vs o1 Open AI.
Comentario adicional: Deepseek V3 no pudo visualizar los triángulos, por lo que quedó fuera de la competencia.
Entonces, al parecer la visión de los modelos de Open AI y Deepseek tienen dificultades cuando se tratan de elementos trazados en forma manual, y hasta el momento la visión de QvQ 72B preview tiene una mejor capacidad de visión, y por ende le ha permitido aprovechar su capacidad de cálculo. Probemos un ejercicio aún más retador para este tipo de modelos.
Round 4: geometría
Ahora el problema es más complejo aún para las IA tradicionales, y con esto conoceremos los límites de la IA en la actualidad, ya que a pesar de que son buenas con los cálculos, aún pueden alucinar o tener problemas para visualizar elementos dibujados a mano, así como la posición de los elementos en este tipo de gráficos realizados por humanos.
Resultado 4 – Open AI – respuesta incorrecta
Resultado 4 – QvQ 72B Preview – respuesta incorrecta (después de varios minutos de procesamiento, no terminó el ejercicio, porque estaba dudando de los elementos).
Resultado del round 4: Gana Google Gemini 2.0 Flash Thinking Experimental
Resultado 4 – Google Gemini 2.0 Flash Thinking Experimental
Respuesta realizada manualmente
Comentarios del Round 4 ¿Qué pasó? Ni QvQ 72B preview, ni o1 Open AI lograron resolver el ejercicio, por lo que quedaron descalificadas y superadas por Google Gemini 2.0 Flash Thinking Experimental ¿Ya la probaste? (Lee más de este modelo en “El o1 de Google: Gemini 2.0 Flash Thinking Mode” dando clic aquí)
Comentario final: Deepseek V3 no llegó a realizar el ejercicio, porque no podía visualizar los triángulos o textos realizados a mano.
¿Cómo probar QvQ 72B-preview?
Lo que se viene para los próximos meses son actualizaciones de las IA de China, que seguramente podrán alcanzar los niveles de Google Gemini 2.0 Flash Thinking Experimental, y estaremos pendientes de los modelos Llama 4.0, Grok 3, o3-mini (¿bajará de precio?), LeChat, ¿Claude 4? entre otras IA:
URL: https://huggingface.co/spaces/Qwen/QVQ-72B-preview
Feliz año 2025
Sigamos conversando en las redes sociales en donde me encuentras como @andygarciape (instagram, linkedin, tik tok, o fb) o encuéntrame en los buscadores de Google, o Bing como “Andy Garcia Peña”.
Fuente del dibujo:
Libro Científicos de la Creatividad
y los 7 espacios de la innovación con design thinking (Andy Garcia Peña, 2018)
Ilustrado por Joan Ulloa Artista Gráfico
También te puede interesar leer:
- Google Whisk: remix IA de imágenes sin prompts. Andy Garcia Peña. Blog “Innovar o ser cambiado” vía Diario Gestión. (20/12/2024). https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12
- o3 y o3 mini: Open AI cierra sus 12 días. Andy Garcia Peña. Blog “Innovar o ser cambiado” vía Diario Gestión. (20/12/2024). https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/open-ai-o3.html
- El o1 de Google: Gemini 2.0 Flash Thinking Mode. Andy Garcia Peña. Blog “Innovar o ser cambiado” vía Diario Gestión. (20/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/o1-de-google.html
- IA en Whatsapp: ChatGPT, Copilot, o Meta AI. Andy Garcia Peña. Blog “Innovar o ser cambiado” vía Diario Gestión. (19/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/ia-en-whatsapp.html
- GOOGLE VEO 2 VS SORA OPEN AI. Andy Garcia Peña. Blog “Innovar o ser cambiado” vía Diario Gestión. (18/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/veo-2-vs-sora.html
- Search GPT de Open AI vs Google Search. Andy Garcia Peña. Diario Gestión (16/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/search-gpt-google.html
- ChatGPT modo de voz avanzado con visión. Andy Garcia Peña. Diario Gestión (14/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/chatgpt-con-vision.html
- Google Gemini Deep Research vs Chat GPT. Andy Garcia Peña. Diario Gestión (14/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/gemini-deep-research.html
- Google Gemini 2.0 Flash destronó a Chat GPT. Andy Garcia Peña. Diario Gestión (11/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/gemini-rival-chatgpt.html
- Día 3 de los 12 días de Open AI: Sora. Andy Garcia Peña. Diario Gestión (09/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/sora-open-ai.html
- Guerra IA: Anthropic lanza Claude Styles. Andy Garcia Peña. Diario Gestión (09/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/anthropic-claude-styles.html
- Google Gemini 1206 superó a ChatGPT. Andy Garcia Peña. Diario Gestión (09/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/gemini-1206-chatgpt.html
- Guerra IA: Grok vs ChatGPT. Andy Garcia Peña. Diario Gestión (09/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/grok-vs-chatgpt.html
- 12 días de Open AI: Chatgpt pro a $200 y o1 pro. Andy Garcia Peña. Diario Gestión (05/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/chagpt-pro-o1.html
- Los 12 días de Open AI: Sora, o1 y mucho más. Andy Garcia Peña. Diario Gestión (05/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/12-open-ai.html
- ¿Amazon-IA? Amazon lanza Nova AI. Andy Garcia Peña. Diario Gestión (05/12/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/12/amazon-nova-ai.html
- Eleven Labs vs Google Notebook LM: podcast IA. Andy Garcia Peña. Diario Gestión (29/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/eleven-labs-genfm.html
- La IA de Alibaba QwQ reta a Open AI o1. Andy Garcia Peña. Diario Gestión (29/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/alibaba-qwq-ia.html
- IA Agentes Autónomos: Runner H. Andy Garcia Peña. Diario Gestión (25/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/runner-h.html
- De China su IA: Deepseek r1 reta a Open AI o1. Andy Garcia Peña. Diario Gestión (22/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/de-china-su-ia-deepseek-r1-reta-a-open-ai-o1.html
- Mistral AI: la alternativa gratuita a ChatGPT Plus. Andy Garcia Peña. Diario Gestión (19/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/mistral-lechat-chatgptplus.html
- IA vs Doctores: ¿extensión o extinción?. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (18/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/ia-vs-doctores.html
- “Google Gemini Live: modo de voz activado”. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (16/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/google-gemini-live.html
- Google Gemini supera a Chat GPT4o. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (15/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/google-gemini-exp1114.html
- Open AI: Work with apps ¿agentes autónomos con IA? Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (15/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/work-with-apps.html
- IA Comunicación Audiovisual: ¿Extinción? Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (14/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/ia-comunicacion-audiovisual.html
- “IA y el Estado Peruano: ¿Extensión o Extinción?” Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (14/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/ia-estado-peruano.html
- “IA y programadores: extensión o extinción” Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (13/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/ia-y-programadores.html
- “Lienzos de modelo de negocios con IA”. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (13/11/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/negocios-con-ia.html
- IA y Artistas Gráficos: extensión o extinción. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (13/11/2024). URL https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/11/ia-artistas-graficos.html
- El adiós de google: Open AI lanzó Search GPT. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (31/10/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/10/el-adios-de-google-open-ai-lanzo-search-gpt.html
- “STORM: adiós a la redacción de artículos académicos?” Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (29/10/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/10/storm-redaccion-articulos.html
- “Agentes autónomos IA: Claude se adelanta a Open AI” Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (23/10/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/10/claude-agentes-autonomos.html
- “Google Notebook LM: IA para estudiantes”. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (10/10/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/10/notebook-lm-ia.html
- “Tiembla Meta AI: Microsoft Copilot llega a Whatsapp”. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (06/10/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/10/copilot-whatsapp.html
- “Madam Tusan: adiós a la tradición de 10 años”. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (06/10/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/10/madam-tusan-adios.html
- “LetyMind: Entrevista a Andy Erazo”. Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (30/09/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/letymind-andy-erazo.html
- “IA: Hack-que mate a los centros de idiomas” Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión (29/09/2024) https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/idiomas-ia.html
- “Chatgpt: modo de voz avanzado” . Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión. (26/09/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/chatgpt-voz.html
- “Hibridación: carreras universitarias” Blog “Innovar o ser cambiado” Andy Garcia Peña. Diario Gestión. (25/09/2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/hibridacion-carreras-universitarias.html
- “Hibridación: camino a la IA General”. Andy Garcia Peña. Blog: “Innovar o ser cambiado” vía Diario Gestión (Septiembre 2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/hibridacion-ia-general.html
- “o1: la hibridación de Chatgpt” (Septiembre 2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/o1-hibridacion-chatgpt.html
- Hibridación: Canvas en la Economía Circular (Septiembre 2024) URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/hibridacion-economia-circular.html
- “LetyMind: hibridación del reclutamiento”. (Septiembre 2024) URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/letymind-hibridacion-reclutamiento.html
- Fresas con crema: hibridación de pinkberry (Septiembre 2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/fresas-con-crema.html
- AI vs Docentes: innovar o ser cambiado (Septiembre 2024). URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/ai-docente.html
- “Hibridación: Poke Bowls, cuchareables y más” (Septiembre 2024) URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/hibridacion-cuchareables-bowls.html
- IA ¿hack-que mate a la educación universitaria? (Septiembre 2024) URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/ia-educacion.html
- “IA ROBOT: el futuro del trabajo en riesgo”. (Septiembre 2024): URL: https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/09/ia-robot-trabajo.html
- “Los cuchareables de creatividad e innovación: Alessandra Penny” URL (Septiembre 2024) https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/08/cuchareables-de-creatividad.html
- “Fijaciones mentales: Rompiendo las barreras para innovar” (2024) URL https://blogs.gestion.pe/innovar-o-ser-cambiado/2024/01/fijaciones-mentales-barreras-para-innovar.html
Fuentes y referencias
- Qwen2.org. (25/12/2024) URL: https://qwen2.org/qvq-72b-preview/
- Qwen LM – Github IO – (25/12/2024) URL: https://qwenlm.github.io/blog/qvq-72b-preview/
- Matemath Web – Ejercicios de Geometría. URL: https://matemathweb.com/geometria/triangulos/
- Problemas y Ecuaciones – Ejercicios de Álgebra. URL: https://www.problemasyecuaciones.com/algebra/polinomios/dividir/division-polinomial-ejemplos-polinomios-divisiones-resueltas.html