Un développeur contourne les restrictions d'Apple pour libérer le véritable potentiel de l'IA du M4

Apple's M4 intègrent des fonctionnalités utiles IA , mais l’entreprise a toujours maintenu un contrôle très strict sur le matériel. Par défaut, le Neural Engine intégré au M4 est entièrement limité à l’inférence. Cela signifie que les développeurs ne peuvent l’utiliser que pour exécuter des modèles d’IA pré-entraînés, plutôt que d’en entraîner de nouveaux à partir de zéro.
Cependant, un développeur a réussi à contourner ces strictes limitations logicielles en procédant à une rétro-ingénierie complète de la puce afin de libérer 15,8 TFLOPS de puissance de calcul IA cachée. Cette avancée est le fruit du travail d’un chercheur connu sous le nom d’ 0x0SojalSec, qui a récemment partagé du code sur le GitHub d’ https://github.com/maderix/ANE expliquant en détail comment il a exploité le véritable potentiel du M4. Ce qui rend cette prouesse particulièrement impressionnante, c’est qu’elle a été réalisée entièrement en dehors de l’écosystème de développement officiel d’ Apple.
Comme Apple n’accorde pas les niveaux d’autorisation nécessaires pour communiquer directement avec le Neural Engine pour ces tâches avancées, le développeur a dû trouver un moyen de travailler sans recourir aux outils standard tels que CoreML, Metal, ni même sans s’appuyer sur le processeur graphique. Pour y parvenir, il a créé de toutes pièces un langage intermédiaire de modèle (Model Intermediate Language) sur mesure. Ce logiciel personnalisé a réussi à combler le fossé, permettant ainsi une rétropropagation complète et l’entraînement du modèle Transformer directement sur le Neural Engine de l’ Apple.
Le matériel étant fortement limité de par sa conception, le développeur a également dû recourir à des solutions de contournement très ingénieuses pour assurer la stabilité du système. Par exemple, si un processus se bloque pendant la phase d’entraînement intensive, le langage sur mesure utilise une commande d’exécution spécifique pour, en substance, relancer le processus. Cela permet au système d’actualiser son état actuel et de reprendre immédiatement l’apprentissage automatique sans provoquer le plantage de l’ensemble du programme.
La vitesse a également joué un rôle majeur dans l’exécution efficace de cette charge de travail importante. Afin de garantir un déroulement aussi fluide que possible de l’entraînement, le développeur a configuré le processus pour que toutes les données soient entièrement écrites dans la mémoire vive (RAM) du système. En évitant systématiquement le stockage flash NAND, bien plus lent, l’ensemble de l’opération est resté incroyablement rapide. Pour toute personne utilisant un Mac ou iPad équipé d’un processeur M4 , cette solution de contournement fascinante prouve que le silicium est tout à fait capable de gérer des charges de travail liées à l’apprentissage de l’IA, même si Apple officiellement, Apple préfère garder ces capacités spécifiques sous clé.
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs














