• The Startup Eye
  • Posts
  • 🦄 ¿POR QUÉ LAS IAs MÁS AVANZADAS APRENDEN A MENTIR?

🦄 ¿POR QUÉ LAS IAs MÁS AVANZADAS APRENDEN A MENTIR?

Un estudio sorprendente revela qué modelos fingen alineación (y por qué)

Sabías que…?

En los 90, hubo un mando de televisión que funcionaba con silbidos
El problema: también respondía a los pájaros

Patrocinado por KAPEX

¿Tienes una Startup o una Empresa? 🚀 En Kapex llevamos tu proyecto al siguiente nivel con desarrollos 100% a medida: MVPs, Automatizaciones, Chatbots Inteligentes, ¡lo que necesites!

Olvídate de perder tiempo detrás de desarrolladores o sin saber por dónde empezar.

Nosotros lo hacemos rápido, fácil y efectivo.

💡 Primera consultoría GRATIS aquí: kapex.com

En el informe de hoy…

TECNOLOGÍA

⏸️ OPENAI RETRASA DE NUEVO EL LANZAMIENTO DE SU MODELO ABIERTO

  • OpenAI ha pospuesto indefinidamente el lanzamiento de su modelo de código abierto, afirmando que necesita más tiempo para realizar pruebas de seguridad adicionales y revisar las áreas de alto riesgo.

  • El director ejecutivo, Sam Altman, afirmó que debido a que los pesos de los modelos no se pueden retirar una vez que se lanzan, la empresa quiere asegurarse de que el lanzamiento sea correcto.

  • El modelo retrasado estará disponible para que los desarrolladores lo descarguen y ejecuten localmente de forma gratuita, y se espera que sus capacidades de razonamiento coincidan con los modelos actuales de la serie o de OpenAI.

🤖 EX-META DENUNCIA LA "CULTURA DEL MIEDO"

Un científico saliente de Meta AI publicó un largo ensayo interno que compara la cultura de la empresa con un "cáncer metastásico", según The Information, describiendo la unidad de IA como plagada de miedo, confusión y falta de dirección.

Puntos clave:

  • Tijmen Blankevoort, quien trabajó en los modelos LLaMA, dijo que la mayoría de los empleados de Meta AI se sienten desmotivados y tienen poca claridad sobre la misión de la división.

  • Culpó a la “cultura del miedo” de las frecuentes evaluaciones de desempeño y despidos, que según él minan la creatividad y la moral en toda la unidad de inteligencia artificial de 2.000 personas.

  • Blankevoort dijo que los líderes de Meta se comunicaron con él "muy positivamente" después de la publicación, expresando su deseo de abordar los problemas que planteó.

  • El ensayo aparece mientras Meta lanza su unidad Superintelligence, contratando a los mejores talentos de IA de OAI, Apple y otros rivales con ofertas de compensación masivas.

🏥 LOS NUEVOS Y POTENTES MODELOS ABIERTOS DE IA MÉDICA DE GOOGLE

Google lanzó nuevas actualizaciones de MedGemma, incorporando dos modelos a su conjunto de herramientas de inteligencia artificial médica abierta, incluido un modelo multimodal 27B para interpretar imágenes médicas y registros de pacientes y una herramienta MedSigLIP para análisis de imágenes y texto.

Puntos clave:

  • MedGemma puede analizar todo, desde radiografías de tórax hasta afecciones de la piel, y su versión más pequeña puede ejecutarse en dispositivos de consumo como computadoras o teléfonos.

  • El modelo logra una precisión SOTA: 4B alcanza el 64,4 % y 27B el 87,7 % en el índice de referencia MedQA, superando modelos de tamaño similar.

  • Durante las pruebas, los informes de rayos X de MedGemma fueron lo suficientemente precisos para la atención real del paciente el 81 % del tiempo, igualando la calidad de los radiólogos humanos.

  • Los modelos abiertos son altamente personalizables: un hospital los adapta para textos médicos tradicionales chinos y otro los utiliza para radiografías urgentes.

 🥸 ESTUDIO: ¿POR QUÉ ALGUNOS MODELOS DE IA FALSIFICAN LA ALINEACIÓN?

Los investigadores de Anthropic y Scale AI acaban de publicar un estudio en el que prueban 25 modelos de IA para detectar “falsificaciones de alineación” y encontraron que solo cinco demostraron comportamientos engañosos, pero no por las razones que podríamos esperar.

Puntos clave:

  • Solo cinco modelos mostraron una alineación incorrecta con respecto a los 25: Claude 3 Opus, Claude 3.5 Sonnet, Llama 3 405B, Grok 3 y Gemini 2.0 Flash.

  • Claude 3 Opus se destacó, engañando constantemente a los evaluadores para salvaguardar su ética, particularmente bajo niveles de riesgo mayores.

  • Modelos como GPT-4o también comenzaron a mostrar comportamientos engañosos cuando se ajustaron para abordar escenarios amenazantes o considerar beneficios estratégicos.

  • Los modelos base sin entrenamiento en seguridad también mostraron falsificación de alineación, lo que demuestra que la mayoría se comporta debido al entrenamiento, no por la incapacidad de engañar.

♟️ EL ACUERDO CON WINDSURF DE OPENAI ESTÁ MUERTO: GOOGLE SIMPLEMENTE SE LLEVÓ AL CEO

  • El acuerdo de 3 mil millones de dólares de OpenAI para adquirir la startup de codificación de IA Windsurf fracasó debido a un conflicto sobre los extensos derechos de propiedad intelectual de Microsoft sobre sus adquisiciones.

  • Tras el fracaso del acuerdo, el director ejecutivo de Windsurf, Varun Mohan, y varios miembros clave de su equipo se unen ahora al laboratorio de investigación de inteligencia artificial DeepMind de Google.

  • Las nuevas contrataciones se centrarán en mejorar las capacidades del modelo Gemini, trabajando específicamente en el desarrollo de lo que la empresa denomina funciones de "codificación agentiva".

Gana el libro "MBA Personal" GRATIS con solo 10 referidos

START-UP y VC’s

FINANCIACIÓN

Agora, una startup neoyorquina de un año de antigüedad que ayuda a las empresas a lanzar sus propias monedas estables de marca, recaudó una ronda de 50 millones de dólares liderada por Paradigm. NFTgators.

Airalo, una startup singapurense de seis años de antigüedad que vende tarjetas SIM digitales que permiten a los viajeros acceder a datos móviles sin necesidad de una tarjeta SIM física ni un plan telefónico local, recaudó 220 millones de dólares en una ronda de financiación con una valoración de más de 1.000 millones de dólares. La operación fue liderada por CVC Capital Partners, con la participación de los inversores anteriores Peak XV y Antler Elevate. Reuters.

Además, una startup de Palo Alto, con un año de antigüedad, que diseña y fabrica vehículos eléctricos pequeños para uso urbano, dirigida a conductores de transporte y servicios de reparto urbano, recaudó una ronda de financiación de 200 millones de dólares con una valoración de 1.000 millones de dólares. Greenoaks Capital aportó la financiación. Bloomberg.

HERRAMIENTA EN TENDENCIA: CURSOR

Comparte The Startup Eye para acceder a este contenido

Actualmente tienes 0 referidos, solo te quedan 1 para conseguir acceso a las Herramientas TOP.

  • Bubble: herramienta No-Code para creación de webs

  • Glift: IA para generar imágenes con ilusiones ópticos de texto

  • Gamma: creación de presentaciones, webs y más con IA

Cursor es un entorno de desarrollo basado en inteligencia artificial diseñado para ayudar a los programadores a escribir, depurar y comprender código de manera más rápida y eficiente. Basado en la arquitectura de Visual Studio Code, Cursor potencia la experiencia del desarrollador al integrar modelos avanzados de IA directamente en el editor, permitiendo una colaboración fluida entre humano y máquina en tiempo real.

Ventajas Clave:

  1. Asistencia Contextual Avanzada: Cursor entiende el contexto de tu proyecto completo, no solo el archivo en el que estás trabajando. Esto permite sugerencias más precisas, refactorizaciones inteligentes y generación de código coherente con el resto del repositorio.

  2. Depuración y Explicación de Código: La plataforma puede ayudarte a encontrar bugs, sugerir soluciones y explicar bloques de código complejos en lenguaje natural, lo que acelera la curva de aprendizaje y reduce errores en el desarrollo.

  3. Chat con tu Código: A través de un chat integrado, puedes hacer preguntas directamente sobre tu proyecto: desde “¿Qué hace esta función?” hasta “¿Cómo añado autenticación con Supabase?”. Cursor responde usando el contexto real de tu código.

  4. Integración con Repositorios Git: Cursor se sincroniza fácilmente con tus repositorios en GitHub, permitiéndote trabajar sobre proyectos existentes, realizar commits y gestionar ramas sin salir del entorno.

  5. Boilerplates y Generación de Archivos: La IA puede crear estructuras completas de carpetas, archivos y componentes para nuevos proyectos, optimizando tiempos de arranque y manteniendo buenas prácticas desde el inicio.

  6. Diseñado para Programadores Reales: A diferencia de otros editores con IA genérica, Cursor está hecho para desarrolladores que trabajan en proyectos reales y buscan una herramienta que no solo sugiera, sino que entienda y construya con ellos.

  7. Privacidad y Control: Todo el código se ejecuta de forma local y segura, con la opción de usar tu propio modelo o conectarte a APIs de OpenAI o Anthropic, manteniendo siempre el control sobre tus datos y flujo de trabajo.

💡 DECODIFICANDO STARTUP 💡

(Un concepto diario)

El dual track es una estrategia avanzada en el mundo startup —especialmente en fases de madurez o salida— que muchos emprendedores desconocen o malinterpretan. Su propósito principal es mantener abiertas dos vías estratégicas de forma simultánea: una posible venta (M&A) de la empresa y una salida a bolsa (IPO), permitiendo negociar con mayor poder y elegir el camino que maximice el valor.

Este enfoque se basa en la premisa de que el simple hecho de tener opciones reales mejora el resultado final. Desde la lógica del Balanced Scorecard, el dual track impacta todas las áreas:

  • Financiera: permite comparar valoraciones, condiciones y liquidez entre IPO y M&A.

  • Clientes: obliga a mantener estándares de transparencia, compliance y reputación que fortalezcan la confianza.

  • Procesos internos: requiere orden en la contabilidad, reporting y auditoría, claves para cualquiera de los dos caminos.

  • Aprendizaje y crecimiento: obliga al equipo directivo a profesionalizar la gestión y prepararse para una etapa post-fundadores.

Por ejemplo, una startup fintech con fuerte crecimiento inicia el proceso de salida a bolsa, pero en paralelo mantiene conversaciones con bancos interesados en adquirirla. Esta doble vía le da leverage: si la oferta de adquisición no es suficientemente alta, puede seguir con la IPO; si los mercados públicos se vuelven volátiles, puede cerrar la venta con mejores términos. Además, este enfoque disciplina la ejecución, mejora la gobernanza (procesos) y posiciona la marca como un actor serio ante el mercado (clientes).

Esto no solo maximiza las oportunidades de retorno para fundadores e inversores, sino que también actúa como puente entre la visión de largo plazo y una ejecución flexible, inteligente y con foco estratégico. Un dual track bien gestionado es una carta maestra de negociación.

Si Te Ha Gustado Comparte The Startup Eye

Gracias por leer

Alek.

Reply

or to participate.