在 2024 年全球开发者大会上,苹果推出 Apple Intelligence,如今相关技术文档放出。报告介绍了 AFM-on-device 和 AFM-server 两款模型,基于 Transformer 架构构建,预训练过程关键,后训练包含监督微调和来自人类反馈的强化学习,并提出新算法。基础模型为 Apple Intelligence 设计,采用适配器架构、量化等技术,评估显示其语言和推理能力强,与其他模型相比有优势,且对对抗性提示鲁棒,注重保护用户隐私。
在 2024 年全球开发者大会上,苹果推出 Apple Intelligence,如今相关技术文档放出。报告介绍了 AFM-on-device 和 AFM-server 两款模型,基于 Transformer 架构构建,预训练过程关键,后训练包含监督微调和来自人类反馈的强化学习,并提出新算法。基础模型为 Apple Intelligence 设计,采用适配器架构、量化等技术,评估显示其语言和推理能力强,与其他模型相比有优势,且对对抗性提示鲁棒,注重保护用户隐私。