首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了

Llama 3.1 大模型信息在 Reddit 上泄露,包括各版本基准测试结果,显示其性能提升,8B 和 70B 模型由 405B 蒸馏而来。Llama 3.1 模型卡流出,其使用公开来源的 15T+ tokens 训练,支持多语言,有优化的 Transformer 架构等。该模型旨在用于多语言商业应用及研究,支持多种用途,训练涉及硬件、能耗等,存在安全风险考量,开发人员使用时需注意相关问题并进行安全测试和微调。

上一篇:

下一篇:

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信