En los últimos meses, Apple ha estado trabajando silenciosamente en una serie de proyectos de inteligencia artificial que están destinados a cambiar radicalmente la forma en que interactuamos con nuestros dispositivos. Desde nuevas herramientas para modificar imágenes y crear vídeos hasta mejoras significativas en Spotlight y Xcode. Pero, ¿qué sabemos exactamente de estas innovaciones y qué efecto tendrán?
Parece que el lanzamiento de iOS 18 va a hacer historia. El mismo Tim Cook ha confirmado que Apple está invirtiendo una “tremenda” cantidad de tiempo y esfuerzo en el desarrollo de tecnología de inteligencia artificial, y están emocionados de compartir los detalles "más adelante este mismo año 2024".
Y no estamos hablando solo de que iOS18 vaya a inspirarse en visionOS, o de que llegue más potencia a Siri y la app Mensajes con una IA propia. Estamos hablando de un sistema operativo que marcará un cambio histórico y estará caracterizado por la integración de una o varias IA profundamente arraigadas en el núcleo de los dispositivos Apple. Todo ello seguramente respaldado por el nuevo Neural Engine mejorado en los próximos iPhone 16 y el existente en los modelos anteriores.
Hasta ahora se han confirmado y presentado dos de estas nuevas herramientas IA, y se rumorean tres más. Vamos a verlas todas.
Edición de Imágenes con Inteligencia Artificial pidiéndoselo a Siri
La herramienta "MGIE" (Edición de Imágenes Guiada por MLLM) es una de las primeras sorpresas, permitiendo ediciones y modificaciones complejas en imágenes mediante simples instrucciones a Siri.
Desarrollada en colaboración con académicos de la Universidad de California, MGIE utiliza Modelos de Lenguaje Grande Multimodal (MLLM) para interpretar peticiones verbales y ejecutar ediciones precisas a nivel de píxel. Esto incluye desde ajustes globales como cambiar la iluminación, la nitidez y el contraste, hasta ediciones específicas como alterar el color de objetos individuales o añadir elementos no presentes en la imagen original.
Además, permite modificar la forma, tamaño, color o textura de regiones u objetos específicos en la imagen, e incluso realizar modificaciones al estilo Photoshop como recortar, redimensionar, rotar, añadir filtros, cambiar fondos y fusionar imágenes.
La capacidad de MGIE para comprender y actuar sobre instrucciones complejas como "haz que el cielo sea más azul" o "añade un perro al lado derecho de la imagen" simplifica enormemente la edición de fotos, haciendo accesible la manipulación avanzada de imágenes a un público más amplio. De hecho, el modelo ya está disponible en GitHub, incluyendo el código, los datos y los modelos preentrenados, por lo que, si disponemos del equipo necesario, ya podemos probar el sistema.
Creación de vídeos a partir de texto con Keyframer
Por otro lado, "Keyframer" es una innovación muy significativa en el terreno de la animación de imágenes. Esta herramienta nos permite convertir imágenes estáticas en animaciones dinámicas utilizando comandos de texto simples.
Al cargar una imagen, por ejemplo, de un paisaje, podemos solicitar "crear una secuencia donde el sol se ponga y las estrellas comiencen a brillar", y Keyframer genera automáticamente el código CSS necesario para llevar a cabo esta animación. La herramienta trabaja transformando imágenes en formato vectorial escalable (SVG) y utiliza instrucciones basadas en modelos de lenguaje de gran tamaño (LLMs), a partir de simples indicaciones de texto, para diseñar animaciones complejas que hasta ahora requerirían habilidades avanzadas en diseño gráfico y animación.
Esta capacidad de generar animaciones a partir de descripciones textuales abre nuevos horizontes en la creación de contenido visual, por ejemplo en la app Keynote, donde, al integrarse, permitirá la animación de las diapositivas de una forma nunca antes vista. Un servicio con el que dar vida a nuestras ideas de manera intuitiva y sin la necesidad de dominar software de animación profesional.
Spotlight potenciado por Inteligencia Artificial
Entrando en el terreno de los rumores, como recogen en 9to5 Mac, Apple también está explorando mejorar Spotlight con IA generativa, lo que podría convertirlo en una herramienta de búsqueda y organización mucho más potente. Al integrar modelos de lenguaje de gran tamaño, Spotlight podría ofrecer respuestas a consultas complejas, ejecutar acciones dentro de aplicaciones y proporcionar información en un contexto más amplio, superando sus capacidades actuales limitadas a búsquedas básicas.
Por ejemplo, sería posible que pudiéramos preguntar cómo realizar una tarea específica en una aplicación de productividad y recibiéramos instrucciones detalladas directamente en Spotlight. Además, de interactuar de manera más profunda con el contenido del dispositivo, como accediendo a eventos específicos en el calendario o iniciando llamadas en aplicaciones de comunicación con solo una solicitud verbal o escrita.
Xcode: automatización del desarrollo de Software
En el ámbito del desarrollo de software, los rumores (via macrumors) indican que Apple está preparando también una nueva herramienta de IA en Xcode que promete agilizar la generación de código. Inspirada en soluciones como GitHub Copilot, esta herramienta podría predecir el código y completar bloques basándose en descripciones en lenguaje natural (texto), facilitando enormemente el proceso de desarrollo de aplicaciones.
Además, se espera que esta herramienta tenga la capacidad de convertir código de un lenguaje de programación a otro, optimizando así el flujo de trabajo de desarrollo de aplicaciones multiplataforma. La integración de estas capacidades de IA en Xcode tiene el potencial de acelerar el desarrollo de software, reducir errores y hacer que la programación sea accesible para un público todavía más amplio, incluidos aquellos con menos experiencia en desarrollo.
iWork: Inteligencia Artificial en la Ofimática
Finalmente, conocemos de la adquisición del dominio iWork.ai. Y con ello creemos que Apple insinúa la integración de la IA en su suite de ofimática, sugiriendo que aplicaciones como Pages, Numbers y Keynote podrían recibir mejoras significativas. La IA podría ofrecer sugerencias de diseño basadas en el contenido del documento, análisis de datos avanzados en Numbers y asistencia dinámica en la creación de presentaciones en Keynote.
Además, se especula que la IA podría facilitar la redacción y edición de texto mediante la generación automática de contenido o la reformulación de párrafos para mejorar la claridad y cohesión. También podría integrarse con la capacidad de realizar tareas complejas, como la programación automática de eventos basados en el contenido de un documento o la generación de resúmenes ejecutivos para informes largos.
Aunque Apple ha introducido estas tecnologías de IA sin el bombo mediático de otros lanzamientos, ahora mismo el potencial que tiene para transformar nuestra interacción con la tecnología es inmenso. Estamos al borde de una nueva era en la que la IA se integrará en nuestras vidas digitales, facilitando la creatividad y mejorando la eficiencia en tareas cotidianas. Con todas las esperanzas puestas en iOS 18 y las declaraciones de Tim Cook, el futuro de la tecnología, marcado por los avances en inteligencia artificial, tiene el potencial para ser revolucionario.
En Hanaringo | 4 extensiones de Safari que cambiarán nuestra manera de navegar