阿里通义千问Qwen2大模型今日发布,并在 Hugging Face和 ModelScope上同步开源。Qwen2系列涵盖5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,据称性能超过美国最强的开源模型Llama3-70B;在中英文之外,模型训练数据中增加了27种语言相关的数据,提升了模型的多语言能力;上下文长度支持进一步扩展,最高达128K tokens。
阿里通义千问Qwen2大模型发布并同步开源
上一篇:国产眼科人工智能大模型在广州发布