[实验性] 有开发者破解苹果ANE神经网络引擎 原来M4芯片也能直接训练小模型
嗯,用户让我帮忙总结一下这篇文章的内容,控制在一百个字以内。首先,我需要仔细阅读文章,抓住主要信息。文章讲的是有开发者通过逆向工程破解了苹果的ANE神经网络引擎,发现在M4芯片上可以直接训练AI模型,虽然现在只能训练很小的模型。苹果本来是用ANE来运行AI模型的,但开发者发现了隐藏的功能,证明ANE也能用来训练模型。这可能意味着未来个人设备可以自我学习和训练模型,而不需要依赖云端服务器。 接下来,我需要提炼这些信息,控制在100字以内。重点包括:开发者破解ANE引擎、在M4芯片上训练AI模型、苹果未公开此功能、未来可能实现设备自我学习。 然后,组织语言,确保简洁明了。比如:“开发者通过逆向工程发现苹果M4芯片的ANE神经网络引擎可直接训练AI模型,尽管目前仅限小型模型。此发现揭示了苹果隐藏的功能,未来可能使个人设备实现自我学习和训练。” 这样既涵盖了主要信息,又符合字数要求。 最后检查一下是否准确传达了文章的核心内容,并且没有遗漏重要细节。确认无误后就可以给出总结了。 </think> 开发者通过逆向工程发现苹果M4芯片的ANE神经网络引擎可直接训练AI模型,尽管目前仅限小型模型。此发现揭示了苹果隐藏的功能,未来可能使个人设备实现自我学习和训练。 2026-3-4 00:30:28 Author: www.landiannews.com(查看原文) 阅读量:5 收藏

推广

推广

#人工智能 有开发者通过逆向工程破解苹果 ANE 神经网络引擎,可以在 M4 芯片上直接训练 AI 模型,虽然现阶段只能训练规模极小的模型。ANE 引擎主要是用来运行 AI 模型的,但苹果没说其实该引擎还能用来训练模型,这个新项目证明 M4 等芯片的 ANE 确实也能训练模型,未来或许我们的个人设备都可以自我学习和训练模型。查看全文:https://ourl.co/111996

苹果的 A 和 M 系列芯片都包含用于加速人工智能计算的 ANE 神经网络引擎,该引擎专门用来运行 AI 模型并实现更快和更省电的目的,常规情况下神经网络引擎主要用来运行 AI 模型进行推理。

苹果从来没有说过 ANE 神经网络引擎还可以用来训练模型,现在有开发者通过逆向工程找到苹果隐藏的开关,然后使用 ANE 神经网络引擎训练 AI 模型。

这个项目也证明苹果的 M4 芯片在硬件上就可以用来训练 AI 模型,只不过苹果没有开放而已,未来普通用户或许也能通过这些普通消费级设备训练人工智能模型。

这件事的亮点在于:

通常情况下 AI 公司都需要购买昂贵的英伟达人工智能加速卡来训练模型,这些模型提供极高的性能并且可以组成集群用来大规模训练模型并处理 AI 模型的推理计算。

而现在这个新开源项目证明使用普通的 Mac Mini (M4) 就可以让神经网络引擎帮忙训练模型,虽然现在还只能训练小型模型,但或许未来无论是手机还是电脑都可以用来训练模型,让 iOS 和 macOS 自己学习新东西而不是非得依赖云端人工智能基础设施。

[实验性] 有开发者破解苹果ANE神经网络引擎 原来M4芯片也能直接训练小模型

这个项目实现的内容包括:

支持的模型:目前能够训练非常基础的 Transformer 层,比如有 0.1B (1 亿参数规模) 的小型模型。

速度怎么样:在 M4 芯片上每个步骤的训练仅需 9.3 毫秒 (极快),能够稳定输出 1.78TFLOPS,使用 ANE 引擎性能的 11%。

怎么实现的:开发者通过逆向工程找到苹果没有公开的内部代码,让 ANE 引擎直接执行复杂的计算,比如注意力机制。

但现在还是起步阶段 (实验性玩具):

现阶段这个开源项目还处于起步阶段,所以暂时还不可能直接拿来训练规模较大的模型 (或者说训练能够实际使用的模型),现阶段只能训练参数规模极小的模型 (例如只有 1 层 Transformer)。

其次有些操作芯片是不支持的必须得使用复杂的办法绕过去,而且训练一段时间后还可能需要重启程序 (这是苹果的限制),如果苹果后续更新 macOS 系统则被开发者找到的隐藏开关也可能会消失导致无法继续使用。

所以项目原作者 @Maderix 就明确说明这个项目并不是给普通用户的工具,而是向大家介绍原来苹果的神经网络引擎还可以这么玩。

如果你想动手试试:

项目作者也提供配置指南让有兴趣的用户可以在自己的 M4 设备上动手试试看,硬件要求是搭载 M4 芯片的 Mac Mini 或 MacBook Pro 等,系统则是 macOS 15 或更高版本。

需要将项目内容克隆到本地:https://github.com/maderix/ANE

接着打开系统自带的终端应用执行下面的命令就可以编译运行:

xcrun clang -O2 -framework Foundation -framework IOSurface -framework CoreML -framework Accelerate -ldl -lobjc -o train_large training/train_large.m
./train_large

整个过程不需要额外安装其他软件或工具,基本调用的都是苹果自带的工具,命令运行后就会自动开始训练小模型,你可以看到进度和速度数据等。

目前这个项目创立仅 3 天就已经获得 3,700 颗星星,可见大家对这个项目还是非常热情的,不知道苹果未来是否会逐步开放这种小模型训练功能。


文章来源: https://www.landiannews.com/archives/111996.html
如有侵权请联系:admin#unsafe.sh