阿里通义千问Qwen2大模型发布并同步开源

阿里通义千问Qwen2大模型今日发布，并在 Hugging Face和 ModelScope上同步开源。Qwen2系列涵盖5个尺寸的预训练和指令微调模型，其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B，据称性能超过美国最强的开源模型Llama3-70B；在中英文之外，模型训练数据中增加了27种语言相关的数据，提升了模型的多语言能力；上下文长度支持进一步扩展，最高达128K tokens。