En respuesta, Apple anunció su propio sistema de IA, Apple Intelligence, en junio de 2024. Si bien también se anunció "Siri mejorada por Apple Intelligence", Apple no logró lanzarla en la primavera de 2025, sufriendo repetidos retrasos. Además, en la conferencia de desarrolladores WWDC 25, celebrada en junio de 2025 , Siri apenas se mencionó.
Desde entonces, Apple Intelligence ha mostrado cierto progreso, al menos con funciones como la traducción en tiempo real (Live Translation) y la "Inteligencia Visual" , que analiza las imágenes capturadas por la cámara. Sin embargo, el mundo que Apple había imaginado (donde Siri pudiera conversar con la misma fluidez que ChatGPT y gestionar de forma segura información personal como calendarios y documentos) no se ha materializado ni siquiera dos años después.
Por supuesto, Google y Microsoft aseguran que manejan esa información de forma "segura", pero mientras la información se transmita por internet, no existe la seguridad absoluta. Existe una posibilidad de que los datos sean robados durante la transmisión, y si esto ocurre, el daño sería extremadamente significativo.
Apple Foundation Models = AFM) en colaboración con Google. Esta tercera generación consta de dos modelos que se ejecutan en dispositivos y tres modelos que se ejecutan en la nube privada.El modelo más común, ubicado en el dispositivo (localmente), es el "AFM 3 Core", que se encarga del procesamiento básico. Sin embargo, incluso al procesar datos en la nube privada en un servidor, el AFM 3 Core sigue realizando un procesamiento básico y solo transmite la información mínima necesaria a otros modelos. Por ejemplo, si hay una instrucción para "explicar la canción que me mencionó mi hermana en un mensaje", solo se extraerá el título de la canción y se transmitirá a otros modelos.
Otro modelo local, el "AFM 3 Core Advanced", causó sorpresa. Gestiona la asombrosa cantidad de 20 mil millones de parámetros localmente (con entre 1 y 4 mil millones activados simultáneamente a petición) y cuenta con soporte multimodal estándar, procesando no solo texto, sino también imágenes y sonido. Esto permite una entrada de voz avanzada, como conversaciones, y la salida de voces expresivas. (Sin embargo, este modelo solo es compatible con un número muy limitado de dispositivos, incluidos el iPhone Air, el iPhone 17 Pro/Pro Max, el iPad M4 y posteriores, las Mac M3 y posteriores con 12 GB o más de memoria y las Apple Vision Pro (M5)).
WIRED Japón. Adaptado por Mauricio Serfatty Godoy.