Qwen2.5是什么?
Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。目前,大语言模型已升级至Qwen2.5版本。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。Qwen具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为AI Agent进行互动等多种能力。
Qwen2.5的主要特点
参数规模多样:易于使用的仅解码器稠密语言模型,提供 0.5B 、1.5B 、3B 、7B 、14B 、32B 和 72B 共7种参数规模的模型,并且有基模型和指令微调模型两种变体(其中“ B ”表示“十亿”, 72B 即为 720 亿)大规模数据预训练:利用我们最新的数据集进行预训练,包含多达 18T tokens (其中“ T ”表示“万亿”, 18T 即为 18 万亿)长文本处理能力:在遵循指令、生成长文本(超过 8K tokens )、理解结构化数据(例如,表格)以及生成结构化输出特别是 JSON 方面有了显著改进指令遵循与改进:更加适应多样化的系统提示,增强了角色扮演的实现和聊天机器人的背景设置。上下文理解:支持最多达 128K tokens 的上下文长度,并能生成多达 8K tokens 的文本。多语言支持:支持超过 29 种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等。
如何使用Qwen2.5?
Qwen2.5既提供了开源模型,也开放了API服务,帮助你快速开发或集成生成式AI功能。
1、开源版本:
开源地址:https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9eGithub:https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file在线demo:https://huggingface.co/spaces/Qwen/Qwen2.5
2、API服务
如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API。
API地址:https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm