🦄 OpenAI vs Anthropic: GUERRA de MODELOS

Agentes múltiples. 1M de contexto. Benchmark en llamas

In partnership with

Sabías que…?

Una startup intentó usar plantas como baterías
Generaban energía… mientras estaban vivas

Patrocinador de hoy:

Gracias a este patrocinio, podemos seguir enviándote contenido gratuito cada día.

Solo con hacer clic aquí ya estás apoyando muchísimo a The Startup Eye.
No tienes que pagar nada. Solo haces CLIC y listo.

Es 100% gratis. Y nos ayudas más de lo que imaginas.
🙏 ¡Gracias por estar ahí!

AI in HR? It’s happening now.

Deel's free 2026 trends report cuts through all the hype and lays out what HR teams can really expect in 2026. You’ll learn about the shifts happening now, the skill gaps you can't ignore, and resilience strategies that aren't just buzzwords. Plus you’ll get a practical toolkit that helps you implement it all without another costly and time-consuming transformation project.

(Esto es un patrocinio predeterminado de Beehiiv)

En el informe de hoy…

TECNOLOGÍA

📰 APPLE CRITICADA POR ANUNCIOS DE BAJA CALIDAD EN APPLE NEWS

  • Apple enfrenta críticas por mostrar anuncios de baja calidad y apariencia fraudulenta en Apple News, un problema vinculado a su controvertida asociación con la empresa de tecnología publicitaria Taboola que se informó por primera vez en 2024.

  • El periodista tecnológico Kirk McElhearn compartió ejemplos de anuncios sospechosos en Apple News que presentaban imágenes de productos generadas por IA, dominios de empresas creados recientemente y un anuncio que aún mostraba una marca de agua de Google Gemini.

  • La situación no es buena para el creciente esfuerzo de Apple por incorporar más anuncios en su ecosistema, especialmente porque Apple News+ todavía muestra anuncios a pesar de costar 13 dólares al mes.

🚀 EL GPT-5.3-CODEX DE OPENAI AYUDA A CONSTRUIRSE A SÍ MISMO

OpenAI acaba de lanzar GPT-5.3-Codex, un nuevo modelo de codificación insignia que fusiona sus mejores capacidades de programación y razonamiento en un paquete más rápido, al mismo tiempo que sirve como una herramienta clave en su propio proceso de capacitación e implementación.

Puntos clave:

  • OpenAI dijo que las primeras versiones de 5.3-Codex se utilizaron para encontrar errores en sus propias ejecuciones de entrenamiento, administrar su implementación y analizar los resultados de la evaluación.

  • Codex supera los benchmarks de codificación agentic como SWE-Bench Pro y Terminal-Bench 2.0, superando a Opus 4.6 en un 12 % en este último apenas minutos después de su lanzamiento.

  • En OSWorld, un estudio de referencia que prueba el control de IA en computadoras de escritorio, el modelo obtuvo un puntaje de 64,7%, casi el doble del 38,2% de la versión anterior del Codex.

  • OpenAI marcó el modelo como su primera calificación de riesgo de ciberseguridad "Alta" y comprometió $10 millones en créditos API para financiar la investigación de seguridad defensiva.

🚀 OPUS 4.6 DE ANTHROPIC CON 'EQUIPOS DE AGENTES', CONTEXTO 1M

Anthropic lanzó Claude Opus 4.6, el nuevo modelo más poderoso de la compañía, que incluye colaboración entre múltiples agentes en Claude Code, una ventana de contexto masiva y nuevas integraciones de Office que colocan la IA directamente dentro de PowerPoint.

Puntos clave:

  • Una nueva función de "equipos de agentes" en Claude Code permite que varios agentes de IA dividan un solo proyecto y trabajen simultáneamente en lugar de manejar los pasos uno a la vez.

  • Opus 4.6 trae una ventana de contexto de token de 1 millón al nivel Opus de Anthropic por primera vez, igualando lo que Sonnet ofrece para el trabajo pesado con documentos y códigos.

  • Las nuevas barras laterales de Excel y PowerPoint permiten a Claude leer las plantillas existentes de los usuarios y crear modelos o presentaciones de forma nativa sin tener que copiar y pegar entre herramientas.

  • 4.6 superó la mayoría de los puntos de referencia de agentic, incluido un salto en ARC-AGI-2 a casi el 70%, aunque el Codex 5.3 de OAI recuperó los máximos de codificación de agentic minutos después.

💼 FRONTIER DE OPENAI PARA GESTIONAR 'COMPAÑEROS DE TRABAJO DE IA'

OpenAI acaba de lanzar Frontier, una nueva plataforma para que las empresas implementen y administren agentes de IA como si fueran nuevos empleados, con incorporación, permisos y evaluaciones de desempeño completos en toda la pila tecnológica existente de la empresa.

Puntos clave:

  • Frontier se conecta a sistemas empresariales existentes, como CRM y herramientas de tickets, lo que permite a los agentes extraer contexto de toda la empresa sin necesidad de migraciones.

  • Los ciclos de evaluación y retroalimentación integrados permiten que los agentes aprendan a través de la experiencia, y OAI lo compara con la incorporación de un nuevo empleado con evaluaciones y límites.

  • Cada agente opera bajo su propio perfil con acceso restringido y límites estrictos sobre lo que puede tocar para el control empresarial y regulado.

  • HP, Oracle, State Farm y Uber se encuentran entre los primeros en adoptar la tecnología, con ingenieros de integración de OAI en el sitio para ayudar a los equipos a poner a los agentes en producción.

LA UE DICE QUE TIKTOK DEBE ABANDONAR EL "DISEÑO ADICTIVO"

  • La Comisión Europea anunció conclusiones preliminares de que el diseño adictivo de TikTok, que incluye funciones como el desplazamiento infinito, infringe la Ley de Servicios Digitales y no protege adecuadamente a los usuarios.

  • Los reguladores dijeron que las advertencias de tiempo de pantalla diario de TikTok son "fáciles de ignorar" y sus controles parentales requieren demasiado esfuerzo, por lo que la empresa debe "cambiar el diseño básico de su servicio".

  • TikTok calificó los hallazgos de "categóricamente falsos y totalmente infundados" y prometió impugnarlos, mientras que la investigación en curso podría eventualmente conducir a multas de hasta el 6 por ciento de la facturación anual global.

START-UP y VC’s

FINANCIACIÓN

Accrual, una startup angelina de dos años de antigüedad que automatiza los flujos de trabajo de preparación y revisión de impuestos para firmas de contabilidad mediante aprendizaje automático, recaudó una ronda de financiación Serie A de $75 millones liderada por General Catalyst, con la participación de Pruven Capital, Edward Jones Ventures y Patrick y John Collison. Bloomberg.

Adaption Labs, una startup con sede en San Francisco fundada el año pasado que desarrolla modelos de IA más pequeños y adaptables, diseñados para reducir los costos de computación y permitir el aprendizaje continuo, recaudó una ronda de capital semilla de $50 millones liderada por Emergence Capital Partners, con la participación de Mozilla Ventures, Fifty Years, Threshold Ventures, Alpha Intelligence Capital, E14 Fund y Neo. Fortune.

Anchorage Digital, una startup de San Francisco con nueve años de antigüedad que opera un banco de criptomonedas con autorización federal, recaudó $100 millones de Tether, con una valoración post-money de $4.200 millones. Esta relación se está profundizando: Tether, el mayor emisor mundial de stablecoins vinculadas al dólar, lanzó recientemente su token USAT, emitido por Anchorage Digital. Bloomberg.

📣 Si estás disfrutando de esta newsletter…
No te olvides de hacer clic en el patrocinador.
Es gratis, no tardas nada, y nos das un empujón brutal.

HERRAMIENTA EN TENDENCIA: CURSOR

Comparte The Startup Eye para acceder a este contenido

Actualmente tienes 0 referidos, solo te quedan 1 para conseguir acceso a las Herramientas TOP.

Cursor es un entorno de desarrollo basado en inteligencia artificial diseñado para ayudar a los programadores a escribir, depurar y comprender código de manera más rápida y eficiente. Basado en la arquitectura de Visual Studio Code, Cursor potencia la experiencia del desarrollador al integrar modelos avanzados de IA directamente en el editor, permitiendo una colaboración fluida entre humano y máquina en tiempo real.

Ventajas Clave:

  1. Asistencia Contextual Avanzada: Cursor entiende el contexto de tu proyecto completo, no solo el archivo en el que estás trabajando. Esto permite sugerencias más precisas, refactorizaciones inteligentes y generación de código coherente con el resto del repositorio.

  2. Depuración y Explicación de Código: La plataforma puede ayudarte a encontrar bugs, sugerir soluciones y explicar bloques de código complejos en lenguaje natural, lo que acelera la curva de aprendizaje y reduce errores en el desarrollo.

  3. Chat con tu Código: A través de un chat integrado, puedes hacer preguntas directamente sobre tu proyecto: desde “¿Qué hace esta función?” hasta “¿Cómo añado autenticación con Supabase?”. Cursor responde usando el contexto real de tu código.

  4. Integración con Repositorios Git: Cursor se sincroniza fácilmente con tus repositorios en GitHub, permitiéndote trabajar sobre proyectos existentes, realizar commits y gestionar ramas sin salir del entorno.

  5. Boilerplates y Generación de Archivos: La IA puede crear estructuras completas de carpetas, archivos y componentes para nuevos proyectos, optimizando tiempos de arranque y manteniendo buenas prácticas desde el inicio.

  6. Diseñado para Programadores Reales: A diferencia de otros editores con IA genérica, Cursor está hecho para desarrolladores que trabajan en proyectos reales y buscan una herramienta que no solo sugiera, sino que entienda y construya con ellos.

  7. Privacidad y Control: Todo el código se ejecuta de forma local y segura, con la opción de usar tu propio modelo o conectarte a APIs de OpenAI o Anthropic, manteniendo siempre el control sobre tus datos y flujo de trabajo.

💡 DECODIFICANDO STARTUP 💡

(Un concepto diario)

El market education cost es un concepto poco conocido, pero crítico para las startups que están creando categorías nuevas o introduciendo productos muy innovadores. Su propósito principal es cuantificar el esfuerzo —en tiempo, dinero y comunicación— necesario para que el mercado entienda el problema que resuelve tu producto antes incluso de considerar comprarlo.

Este concepto se basa en la idea de que vender algo nuevo no solo implica convencer, sino enseñar. Cuando una startup introduce una tecnología o modelo desconocido, debe invertir primero en educar al público: explicar por qué el problema existe, por qué las soluciones actuales no bastan y por qué su enfoque es el correcto.

Por ejemplo, Tesla tuvo que educar al mercado sobre la viabilidad de los coches eléctricos antes de venderlos masivamente. Lo mismo ocurrió con Airbnb, que tuvo que enseñar a millones de personas que alquilar la casa de un desconocido podía ser seguro y normal. Ese proceso costó años y millones, pero creó una categoría.

El market education cost determina si una startup puede escalar rápido o necesitará paciencia estratégica. En definitiva, a veces no compites contra otras empresas, sino contra la falta de entendimiento del mercado, y saber medir ese coste puede ser la diferencia entre crear una tendencia o morir explicándola.

Si Te Ha Gustado Comparte The Startup Eye

Gracias por leer

Alek.

Reply

or to participate.