Introduction
Apple travaille actuellement à intégrer le modèle d'IA Gemini dans l'iPhone pour améliorer les capacités de Siri. Cette démarche vise à rattraper le retard d'Apple dans le domaine de l'IA générative.
Contexte Technique
Le modèle Gemini de Google est un modèle d'IA massif qui nécessite des ressources importantes pour fonctionner. Les téléphones intelligents, y compris l'iPhone, ont des processeurs et des mémoires limités qui ne permettent pas de traiter des modèles d'IA de grande taille. Les modèles d'IA locaux sont généralement plus petits, avec quelques milliards de paramètres, alors que les modèles de Google comme Gemini ont des trillions de paramètres.
Les processeurs graphiques (GPU) des téléphones peuvent traiter plus de jetons d'IA que les processeurs d'IA spécialisés (NPU) comme le Neural Engine d'Apple. Cependant, même avec des processeurs plus rapides, les téléphones manquent de mémoire pour stocker des modèles d'IA de grande taille. Les modèles d'IA locaux sont également « quantifiés » pour fonctionner à une précision inférieure, ce qui les rend plus rapides mais affecte leur précision.
Analyse et Implications
Malgré les efforts d'Apple pour promouvoir la valeur de la confidentialité en exécutant l'IA localement, il semble que la version de Siri basée sur Gemini sera exécutée à la fois sur l'appareil et dans le cloud. Cela constitue un revirement par rapport à la préférence de l'entreprise pour l'IA locale.
Les conséquences de cette approche pourraient être importantes, notamment en termes de confidentialité et de sécurité des données. L'exécution d'une partie de l'IA dans le cloud pourrait exposer les données des utilisateurs à des risques de fuite ou de piratage.
Perspective
Il est important de surveiller les prochaines étapes d'Apple dans l'intégration de l'IA Gemini dans l'iPhone. Les limites de l'IA locale et les risques liés à l'exécution de l'IA dans le cloud devraient être pris en compte pour garantir la confidentialité et la sécurité des données des utilisateurs.