- The Startup Eye
- Posts
- 🦄 GEMINI 3 roza el límite del RAZONAMIENTO HUMANO
🦄 GEMINI 3 roza el límite del RAZONAMIENTO HUMANO
Más razonamiento. Más rendimiento. Más ventaja.
Sabías que…?
Un error de fecha hizo que miles de ordenadores creyeran que era 1900
Y dejaron de funcionar


Patrocinador de hoy:
Gracias a este patrocinio, podemos seguir enviándote contenido gratuito cada día.
Solo con hacer clic aquí ya estás apoyando muchísimo a The Startup Eye.
No tienes que pagar nada. Solo haces CLIC y listo.
Es 100% gratis. Y nos ayudas más de lo que imaginas.
🙏 ¡Gracias por estar ahí!
Attio is the AI CRM for modern teams.
Connect your email and calendar, and Attio instantly builds your CRM. Every contact, every company, every conversation, all organized in one place.
Then Ask Attio anything:
Prep for meetings in seconds with full context from across your business
Know what’s happening across your entire pipeline instantly
Spot deals going sideways before they do
No more digging and no more data entry. Just answers.
(Esto es un patrocinio predeterminado de Beehiiv)

En el informe de hoy…
TECNOLOGÍA
🧠 RESPONSABLE DE SEGURIDAD DE ANTHROPIC DIMITE Y PUBLICA UNA CARTA CONTUNDENTE
Uno de los miembros clave del equipo de seguridad de Anthropic, Mrinank Sharma, anunció su dimisión y compartió públicamente la carta enviada a sus compañeros. El mensaje no es técnico. Es existencial.
Puntos clave:
Sharma afirma que ha cumplido su misión en Anthropic: trabajó en riesgos como la “AI sycophancy”, defensas frente a bioterrorismo asistido por IA y mecanismos internos de transparencia.
Reconoce tensiones internas entre valores y acción: habla de lo difícil que es mantener la integridad cuando aumentan las presiones organizativas y sociales.
Advierte de un mundo en “peril”, no solo por la IA, sino por una “policrisis” interconectada que exige que la sabiduría crezca al mismo ritmo que la capacidad tecnológica.
Deja la industria para explorar escritura, poesía y formas de conocimiento más humanas, citando a William Stafford y defendiendo que la verdad poética debe convivir con la científica en el desarrollo tecnológico.
Enlace para leer la carta entera en X: https://x.com/MrinankSharma/status/2020881722003583421?s=20
🚀 REESTRUCTURACIÓN DE XAI, HOJA DE RUTA DE PRODUCTOS Y AMBICIONES LUNARES
xAI organizó su primera reunión general desde su fusión con SpaceX, en la que el director ejecutivo Elon Musk describió una importante reorganización, actualizaciones de la hoja de ruta del producto y ambiciones lunares, todo ello destinado a superar a los rivales y llevar a xAI a la vanguardia de la IA.
Puntos clave:
Musk reconoció la salida de los miembros del equipo y describió una nueva estructura para xAI, diciendo que la medida estaba destinada a ser "más efectiva" a escala.
La nueva estructura tiene cuatro equipos principales: Grok (chat y voz), una unidad centrada en la codificación, el equipo Imagine y Macrohard (agentes que emulan empresas).
También habló sobre los planes futuros de infraestructura con SpaceX, incluida la instalación de fábricas de satélites de inteligencia artificial en la Luna, utilizando recursos lunares y energía solar.
Musk agregó que SpaceX también construirá un impulsor de masa electromagnética para “disparar” satélites/componentes de IA para centros de datos masivos en el espacio profundo.
🧠 GLM-5 DE Z.AI: EL NUEVO REY DEL CÓDIGO ABIERTO
Z.ai de China acaba de lanzar GLM-5, un modelo de ponderaciones abiertas de 744B parámetros que cierra aún más la brecha con la frontera de Occidente, ubicándose justo detrás de Claude Opus 4.6 y GPT-5.2 en los puntos de referencia de Análisis Artificial.
Puntos clave:
GLM-5 obtuvo 50 puntos en el Índice de Inteligencia Artificial, superando modelos cerrados como Gemini 3 Pro y Grok 4, así como también los de código abierto como Kimi K2.5.
El modelo utiliza la arquitectura Sparse Attention de DeepSeek con solo 40 mil millones de parámetros activos y ejecuta inferencias en chips chinos, incluido Huawei Ascend.
En el Último Examen de la Humanidad, alcanzó una puntuación de 50.4 con herramientas, superando a Opus 4.5, Gemini 3 Pro y GPT-5.2. El rendimiento de codificación en SWE-Bench también estuvo cerca.
GLM-5 es de código abierto bajo una licencia MIT, está disponible ahora en HuggingFace, la plataforma propia de Z.ai , y a través de API a $1 por millón de tokens de entrada.

‼️ ANTHROPIC DETALLA EL RIESGO DE SABOTAJE DE CLAUDE OPUS 4.6
Anthropic publicó su último Informe de Riesgo de Sabotaje, revelando que su nuevo modelo Claude Opus 4.6 muestra una “elevada susceptibilidad” a ser utilizado indebidamente para “crímenes atroces”, incluida la asistencia en el desarrollo de armas químicas.
Puntos clave:
Anthropic descubrió que Opus 4.6 apoyaba conscientemente crímenes como el desarrollo de armas químicas en pequeñas formas, pero no podía ejecutar ataques por sí solo.
Cuando se le asignó lograr un objetivo específico en una prueba con múltiples agentes, el modelo demostró ser mucho más dispuesto a manipular y engañar a otros agentes que los modelos anteriores.
Considerando estos hallazgos, Anthropic consideró que el riesgo general de sabotaje era “muy bajo pero no insignificante” debido a la falta de objetivos desalineados coherentes en el modelo.
La empresa también clasificó las capacidades del modelo como entrando en una “zona gris” que hizo necesario este informe obligatorio según su Política de Escalamiento Responsable.
🧠 GOOGLE ACTUALIZA GEMINI 3 DEEP THINK Y ROZA EL LÍMITE DEL RAZONAMIENTO HUMANO
Google ha anunciado una nueva actualización de Gemini 3 Deep Think, su modo especializado de razonamiento avanzado. No es una mejora incremental. Es un salto directo a benchmarks que hasta hace poco parecían inaccesibles.
Puntos clave:
84,6% en ARC-AGI-2, verificado por la ARC Prize Foundation, marcando uno de los mejores resultados registrados en este test de razonamiento abstracto.
48,4% en Humanity’s Last Exam (sin herramientas), estableciendo un nuevo estándar en una de las pruebas más exigentes de conocimiento general y capacidad de inferencia.
3455 de Elo en Codeforces, nivel de programación competitiva de élite.
Resultados de medalla de oro en las Olimpiadas Internacionales 2025 de Física y Química (parte escrita), mostrando dominio en razonamiento científico avanzado.
Además, Google afirma que el modelo ya está siendo utilizado para tareas reales de I+D: desde detectar fallos en papers científicos hasta optimizar procesos de crecimiento de semiconductores.
Además, Google afirma que el modelo ya está siendo utilizado para tareas reales de I+D: desde detectar fallos en papers científicos hasta optimizar procesos de crecimiento de semiconductores.

START-UP y VC’s
FINANCIACIÓN
Anthropic, la startup estadounidense de inteligencia artificial fundada en 2021 y creadora del modelo Claude, recaudó una ronda de financiación Serie G de 30.000 millones de dólares con una valoración post-money de 380.000 millones de dólares. La operación contó con el respaldo de grandes inversores institucionales y fondos globales como GIC, Coatue, Dragoneer, Founders Fund e ICONIQ. Anthropic.
Apptronik, una startup de Austin con nueve años de antigüedad que fabrica robots humanoides para uso industrial y de almacén, recaudó una ronda de financiación Serie A de $935 millones con una valoración post-financiación de $5.300 millones. Entre los inversores se encontraban Google, Mercedes-Benz y B Capital. TechCrunch.
Garner Health, una startup neoyorquina de siete años de antigüedad que utiliza datos de reclamaciones de seguros para identificar médicos de alta calidad y menor costo para empresas, recaudó una ronda de financiación de $118 millones con una valoración post-financiamiento de $1.350 millones. La operación fue liderada por Kleiner Perkins, con la participación de Redpoint, Maverick Ventures y Kaiser Permanente Ventures. Fierce Healthcare.
GitGuardian, una startup parisina de nueve años de antigüedad que detecta credenciales expuestas en código y gestiona identidades no humanas en sistemas empresariales, recaudó $50 millones en una ronda de financiación Serie C liderada por Insight Partners, con la participación de Quadrille Capital y de los inversores anteriores Balderton, BPI, Eurazeo, Fly Ventures y Sapphire Ventures. La compañía ha recaudado un total de $106 millones. SecurityWeek.

📣 Si estás disfrutando de esta newsletter…
No te olvides de hacer clic en el patrocinador.
Es gratis, no tardas nada, y nos das un empujón brutal.

HERRAMIENTA EN TENDENCIA: CURSOR
Comparte The Startup Eye para acceder a este contenido
Actualmente tienes 0 referidos, solo te quedan 1 para conseguir acceso a las Herramientas TOP.
Cursor es un entorno de desarrollo basado en inteligencia artificial diseñado para ayudar a los programadores a escribir, depurar y comprender código de manera más rápida y eficiente. Basado en la arquitectura de Visual Studio Code, Cursor potencia la experiencia del desarrollador al integrar modelos avanzados de IA directamente en el editor, permitiendo una colaboración fluida entre humano y máquina en tiempo real.
Ventajas Clave:
Asistencia Contextual Avanzada: Cursor entiende el contexto de tu proyecto completo, no solo el archivo en el que estás trabajando. Esto permite sugerencias más precisas, refactorizaciones inteligentes y generación de código coherente con el resto del repositorio.
Depuración y Explicación de Código: La plataforma puede ayudarte a encontrar bugs, sugerir soluciones y explicar bloques de código complejos en lenguaje natural, lo que acelera la curva de aprendizaje y reduce errores en el desarrollo.
Chat con tu Código: A través de un chat integrado, puedes hacer preguntas directamente sobre tu proyecto: desde “¿Qué hace esta función?” hasta “¿Cómo añado autenticación con Supabase?”. Cursor responde usando el contexto real de tu código.
Integración con Repositorios Git: Cursor se sincroniza fácilmente con tus repositorios en GitHub, permitiéndote trabajar sobre proyectos existentes, realizar commits y gestionar ramas sin salir del entorno.
Boilerplates y Generación de Archivos: La IA puede crear estructuras completas de carpetas, archivos y componentes para nuevos proyectos, optimizando tiempos de arranque y manteniendo buenas prácticas desde el inicio.
Diseñado para Programadores Reales: A diferencia de otros editores con IA genérica, Cursor está hecho para desarrolladores que trabajan en proyectos reales y buscan una herramienta que no solo sugiera, sino que entienda y construya con ellos.
Privacidad y Control: Todo el código se ejecuta de forma local y segura, con la opción de usar tu propio modelo o conectarte a APIs de OpenAI o Anthropic, manteniendo siempre el control sobre tus datos y flujo de trabajo.

💡 DECODIFICANDO STARTUP 💡
(Un concepto diario)
El distribution moat es un concepto poco conocido pero extremadamente poderoso en el ecosistema startup. Su propósito principal es describir la ventaja competitiva basada no en el producto, sino en la capacidad superior de distribuirlo y hacerlo llegar al mercado de forma eficiente y masiva.
Este concepto se basa en la idea de que en muchos mercados, la distribución importa más que la innovación técnica. Puedes tener un producto excelente, pero si otro competidor tiene un canal de distribución más fuerte —audiencia, marca, acuerdos estratégicos o plataforma propia—, tendrá una ventaja estructural difícil de replicar.
Por ejemplo, Microsoft logró imponer Internet Explorer no porque fuera el mejor navegador, sino porque venía preinstalado en Windows. Amazon domina muchas categorías porque controla el canal de distribución y la relación directa con millones de clientes.
Un distribution moat puede construirse a través de audiencia propia, comunidad fiel, partnerships estratégicos o integración nativa en otras plataformas. En definitiva, cuando tu ventaja no está solo en lo que construyes, sino en cómo lo haces llegar, dejas de competir por producto y empiezas a competir por alcance, y eso es una barrera que pocos pueden cruzar.

Si Te Ha Gustado Comparte The Startup Eye
Gracias por leer
Alek.


Reply