- The Startup Eye
- Posts
- 🦄 La poesía “ROMPE” la IA
🦄 La poesía “ROMPE” la IA
Versos que engañan modelos y desbloquean instrucciones nucleares
Sabías que…?
Un satélite de los 60 llevaba grabado un disco de oro con saludos en 55 idiomas


Patrocinador de hoy:
Gracias a este patrocinio, podemos seguir enviándote contenido gratuito cada día.
Solo con hacer clic aquí ya estás apoyando muchísimo a The Startup Eye.
No tienes que pagar nada. Solo haces CLIC y listo.
Es 100% gratis. Y nos ayudas más de lo que imaginas.
🙏 ¡Gracias por estar ahí!
Startups who switch to Intercom can save up to $12,000/year
Startups who read beehiiv can receive a 90% discount on Intercom's AI-first customer service platform, plus Fin—the #1 AI agent for customer service—free for a full year.
That's like having a full-time human support agent at no cost.
What’s included?
6 Advanced Seats
Fin Copilot for free
300 Fin Resolutions per month
Who’s eligible?
Intercom’s program is for high-growth, high-potential companies that are:
Up to series A (including A)
Currently not an Intercom customer
Up to 15 employees
(Esto es un patrocinio predeterminado de Beehiiv)

En el informe de hoy…
TECNOLOGÍA
🫠 LOS POEMAS PUEDEN ENGAÑAR A LA IA PARA QUE FABRIQUE ARMAS NUCLEARES
Los investigadores descubrieron que los actores maliciosos pueden eludir los filtros de seguridad en modelos de lenguaje grandes simplemente formulando solicitudes maliciosas como poesía, logrando tasas de éxito de hasta el 100 por ciento en 25 sistemas líderes.
Después de que el equipo convirtió 1.200 indicaciones del MLCommons AILuminate Safety Benchmark en verso, las variantes poéticas demostraron ser tres veces más efectivas que la prosa para engañar a Google Gemini 2.5 Pro y Deepseek.
El estudio sugiere que las estructuras rítmicas y las metáforas condensadas alteran los mecanismos de reconocimiento de patrones, lo que demuestra que los puntos de referencia estáticos a menudo sobreestiman lo bien que las empresas bloquean el contenido dañino cuando está oculto dentro de la expresión creativa.
🤖 EL NUEVO RAZONADOR DE DEEPSEEK SUPERA CON CRECES LAS EXPECTATIVAS DE LA OMI PARA 2025
DeepSeek acaba de lanzar DeepSeek-Math-V2, un modelo MoE de código abierto que logró un desempeño de medalla de oro en la IMO 2025, democratizando el razonamiento matemático de “nivel de investigación” que anteriormente estaba encerrado tras muros propietarios.
Puntos clave:
El modelo obtuvo una puntuación de 118/120 en la competencia Putnam 2024 (superando la puntuación humana más alta) y resolvió 5 de los 6 problemas IMO 2025, alcanzando el estándar de oro.
En IMO ProofBench, alcanzó el 61,9%, casi igualando al Gemini Deep Think especializado de Google que ganó el oro en IMO y aplastando a GPT-5, que obtuvo solo el 20%.
Math-V2 utiliza un sistema generador-verificador donde un modelo propone una prueba y otro la critica, en lugar de recompensar solo las respuestas finales.
El verificador asigna puntajes de confianza a los pasos, lo que obliga al generador a refinar la lógica débil y garantiza la autodepuración paso a paso del razonamiento.
‼️ LOS DATOS DE LOS USUARIOS DE LA API DE OPENAI SE FILTRARON EN UNA BRECHA DE SEGURIDAD DE TERCEROS.
OpenAI acaba de revelar que su proveedor de análisis Mixpanel sufrió un incidente de seguridad, en el que un atacante exportó parte de la información de perfil de los usuarios de su API, aunque no se vieron comprometidos datos de chat, claves API, detalles de pago ni credenciales.
Puntos clave:
La violación ocurrió el 9 de noviembre, y afectó los sistemas de Mixpanel que proporcionaban análisis web en la interfaz frontend del producto API de OpenAI .
Los datos que exportó el atacante incluían información de perfil asociada con el producto API, como nombres, correos electrónicos, ubicaciones (ciudad/estado) y detalles del dispositivo.
OpenAI confirmó que los usuarios de ChatGPT y otros productos no se vieron afectados y que no se filtraron datos de chat, API, credenciales ni detalles de pago.
Eliminó Mixpanel y está notificando directamente a los usuarios afectados, al tiempo que insta a la vigilancia ante posibles intentos de phishing que podrían utilizar los datos filtrados.
📈 EL ARGUMENTO DE NVIDIA A FAVOR DE LA ESCALABILIDAD NO LO ES TODO EN IA
NVIDIA y la Universidad de Hong Kong publicaron un artículo que sugiere que el futuro de la IA podría no provenir de la escalabilidad sino de una orquestación más inteligente, con su nueva herramienta que entrena modelos pequeños que pueden superar a la IA de frontera a una fracción del costo.
Puntos clave:
ToolOrchestra entrena un modelo “orquestador” que decide cuándo razonar internamente y cuándo llamar a herramientas y modelos especializados, en función de la tarea.
Un modelo 8B entrenado con el sistema superó a GPT-5 y Claude Opus 4.1 en el Último Examen de la Humanidad, obteniendo un puntaje de 37.1% y siendo 2.5 veces más eficiente y rápido.
Incluso cuando se probó con herramientas desconocidas, el orquestador se adaptó bien, demostrando su capacidad para trabajar con conjuntos de herramientas y estructuras de precios cambiantes.
Los agentes anteriores utilizaban en exceso las herramientas y los modelos más potentes (y más costosos), pero ToolOrchestra evitó esto orquestando el uso específico de modelos y herramientas.

❌ EL CEO DE EPIC QUIERE QUE STEAM ELIMINE LAS ETIQUETAS "HECHO CON IA"
Steam tiene una política de divulgación de IA para videojuegos, por lo que los desarrolladores deben admitir cuándo usan IA generativa para elementos pregenerados o durante el juego en lugar de que la tienda simplemente los rechace.
Call of Duty: Black Ops 7 reveló que su equipo utiliza herramientas de IA generativa para los activos, pero los jugadores exigieron un reembolso después de ver que las ilustraciones y la escritura no coincidían con las promociones.
El director ejecutivo de Epic, Tim Sweeney, afirma que la etiqueta no tiene sentido porque esta tecnología estará presente en casi toda la producción futura, aunque los clientes detestan encontrar productos de mala calidad en lo que compran.
Gana el libro "MBA Personal" GRATIS con solo 30 referidos
START-UP y VC’s
FINANCIACIÓN
Buildroid AI, una startup de San Francisco con un año de antigüedad que integra robots especializados y de uso general en los flujos de trabajo de contratistas, recaudó una ronda de financiación pre-semilla de 2 millones de dólares. Tim Draper lideró la operación. Wamda.
The Intelligent Search Company (TISC), una startup de un año de antigüedad en el Área de la Bahía y Toronto que desarrolla un sistema para obtener información contextual en tiempo real para la toma de decisiones cruciales, recaudó 2,1 millones de dólares en una ronda pre-semilla codirigida por OVO Fund y n49p, con la contribución de Panache Ventures. Aijourn.
Juo, una startup de Varsovia de cinco años de antigüedad que desarrolla tecnología para crear y gestionar programas de suscripción de productos físicos, recaudó una ronda de capital semilla de 4,6 millones de dólares codirigida por Market One Capital y Peak, que incluye a SMOK Ventures, BADideas, FJ Labs y Lakestar. EU-Startups.

HERRAMIENTA EN TENDENCIA: CURSOR
Comparte The Startup Eye para acceder a este contenido
Actualmente tienes 0 referidos, solo te quedan 1 para conseguir acceso a las Herramientas TOP.
Bubble: herramienta No-Code para creación de webs
Glift: IA para generar imágenes con ilusiones ópticos de texto
Gamma: creación de presentaciones, webs y más con IA
Cursor es un entorno de desarrollo basado en inteligencia artificial diseñado para ayudar a los programadores a escribir, depurar y comprender código de manera más rápida y eficiente. Basado en la arquitectura de Visual Studio Code, Cursor potencia la experiencia del desarrollador al integrar modelos avanzados de IA directamente en el editor, permitiendo una colaboración fluida entre humano y máquina en tiempo real.
Ventajas Clave:
Asistencia Contextual Avanzada: Cursor entiende el contexto de tu proyecto completo, no solo el archivo en el que estás trabajando. Esto permite sugerencias más precisas, refactorizaciones inteligentes y generación de código coherente con el resto del repositorio.
Depuración y Explicación de Código: La plataforma puede ayudarte a encontrar bugs, sugerir soluciones y explicar bloques de código complejos en lenguaje natural, lo que acelera la curva de aprendizaje y reduce errores en el desarrollo.
Chat con tu Código: A través de un chat integrado, puedes hacer preguntas directamente sobre tu proyecto: desde “¿Qué hace esta función?” hasta “¿Cómo añado autenticación con Supabase?”. Cursor responde usando el contexto real de tu código.
Integración con Repositorios Git: Cursor se sincroniza fácilmente con tus repositorios en GitHub, permitiéndote trabajar sobre proyectos existentes, realizar commits y gestionar ramas sin salir del entorno.
Boilerplates y Generación de Archivos: La IA puede crear estructuras completas de carpetas, archivos y componentes para nuevos proyectos, optimizando tiempos de arranque y manteniendo buenas prácticas desde el inicio.
Diseñado para Programadores Reales: A diferencia de otros editores con IA genérica, Cursor está hecho para desarrolladores que trabajan en proyectos reales y buscan una herramienta que no solo sugiera, sino que entienda y construya con ellos.
Privacidad y Control: Todo el código se ejecuta de forma local y segura, con la opción de usar tu propio modelo o conectarte a APIs de OpenAI o Anthropic, manteniendo siempre el control sobre tus datos y flujo de trabajo.

📣 Si estás disfrutando de esta newsletter…
No te olvides de hacer clic en el patrocinador.
Es gratis, no tardas nada, y nos das un empujón brutal.

💡 DECODIFICANDO STARTUP 💡
(Un concepto diario)
El activation rate (tasa de activación) es un concepto poco conocido, pero crítico en las startups que buscan convertir registros en usuarios reales. Su propósito principal es medir el porcentaje de usuarios que completan una acción clave que demuestra que han experimentado el valor central del producto por primera vez.
Este concepto se basa en la idea de que el éxito no está en conseguir que la gente se registre, sino en lograr que realmente “entiendan” el producto. La activación es ese momento en el que el usuario pasa de la curiosidad al compromiso inicial, el famoso “aha moment”.
Por ejemplo, en Twitter (ahora X), la activación ocurre cuando un usuario sigue a 30 cuentas y empieza a ver contenido relevante. En Dropbox, cuando sube su primer archivo. En Notion, cuando crea su primera página y la usa más de una vez.
Un activation rate alto indica que el onboarding y la propuesta de valor están funcionando; uno bajo revela fricción o falta de claridad en el producto. En definitiva, la activación es la puerta de entrada al crecimiento real, porque ningún usuario puede quedarse o pagar por algo que nunca llegó a entender.

Si Te Ha Gustado Comparte The Startup Eye
Gracias por leer
Alek.


Reply