Un développeur contourne les restrictions d'Apple pour libérer le véritable potentiel de l'IA du M4

Apple Puce M4.

Un développeur de la plateforme X a procédé à une ingénierie inverse du M4 Neural Engine d'Apple afin de libérer 15,8 TFLOPS de capacité cachée d'entraînement de l'IA, contournant ainsi les restrictions logicielles d'Apple grâce à un langage intermédiaire de modèle (Model Intermediate Language) personnalisé, entièrement développé en dehors de l'écosystème officiel de développement CoreML et Metal.

Antony Muchiri (traduit par DeepL / Ninh Duy), Publié 06/17/2026 🇺🇸 🇩🇪 ...

AI Apple Laptop / Notebook

Apple's M4 intègrent des fonctionnalités utiles IA , mais l’entreprise a toujours maintenu un contrôle très strict sur le matériel. Par défaut, le Neural Engine intégré au M4 est entièrement limité à l’inférence. Cela signifie que les développeurs ne peuvent l’utiliser que pour exécuter des modèles d’IA pré-entraînés, plutôt que d’en entraîner de nouveaux à partir de zéro.

Cependant, un développeur a réussi à contourner ces strictes limitations logicielles en procédant à une rétro-ingénierie complète de la puce afin de libérer 15,8 TFLOPS de puissance de calcul IA cachée. Cette avancée est le fruit du travail d’un chercheur connu sous le nom d’ 0x0SojalSec, qui a récemment partagé du code sur le GitHub d’ https://github.com/maderix/ANE expliquant en détail comment il a exploité le véritable potentiel du M4. Ce qui rend cette prouesse particulièrement impressionnante, c’est qu’elle a été réalisée entièrement en dehors de l’écosystème de développement officiel d’ Apple.

Comme Apple n’accorde pas les niveaux d’autorisation nécessaires pour communiquer directement avec le Neural Engine pour ces tâches avancées, le développeur a dû trouver un moyen de travailler sans recourir aux outils standard tels que CoreML, Metal, ni même sans s’appuyer sur le processeur graphique. Pour y parvenir, il a créé de toutes pièces un langage intermédiaire de modèle (Model Intermediate Language) sur mesure. Ce logiciel personnalisé a réussi à combler le fossé, permettant ainsi une rétropropagation complète et l’entraînement du modèle Transformer directement sur le Neural Engine de l’ Apple.

Le matériel étant fortement limité de par sa conception, le développeur a également dû recourir à des solutions de contournement très ingénieuses pour assurer la stabilité du système. Par exemple, si un processus se bloque pendant la phase d’entraînement intensive, le langage sur mesure utilise une commande d’exécution spécifique pour, en substance, relancer le processus. Cela permet au système d’actualiser son état actuel et de reprendre immédiatement l’apprentissage automatique sans provoquer le plantage de l’ensemble du programme.

La vitesse a également joué un rôle majeur dans l’exécution efficace de cette charge de travail importante. Afin de garantir un déroulement aussi fluide que possible de l’entraînement, le développeur a configuré le processus pour que toutes les données soient entièrement écrites dans la mémoire vive (RAM) du système. En évitant systématiquement le stockage flash NAND, bien plus lent, l’ensemble de l’opération est resté incroyablement rapide. Pour toute personne utilisant un Mac ou iPad équipé d’un processeur M4 , cette solution de contournement fascinante prouve que le silicium est tout à fait capable de gérer des charges de travail liées à l’apprentissage de l’IA, même si Apple officiellement, Apple préfère garder ces capacités spécifiques sous clé.