Qwen2.5:阿里巴巴最新开源的系列AI大模型

Qwen2.5是什么?

Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。目前,大语言模型已升级至Qwen2.5版本。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。Qwen具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为AI Agent进行互动等多种能力。

Qwen2.5:阿里巴巴最新开源的系列AI大模型

Qwen2.5的主要特点

参数规模多样:易于使用的仅解码器稠密语言模型,提供 0.5B 、1.5B 、3B 、7B 、14B 、32B 和 72B 共7种参数规模的模型,并且有基模型和指令微调模型两种变体(其中“ B ”表示“十亿”, 72B 即为 720 亿)大规模数据预训练:利用我们最新的数据集进行预训练,包含多达 18T tokens (其中“ T ”表示“万亿”, 18T 即为 18 万亿)长文本处理能力:在遵循指令、生成长文本(超过 8K tokens )、理解结构化数据(例如,表格)以及生成结构化输出特别是 JSON 方面有了显著改进指令遵循与改进:更加适应多样化的系统提示,增强了角色扮演的实现和聊天机器人的背景设置。上下文理解:支持最多达 128K tokens 的上下文长度,并能生成多达 8K tokens 的文本。多语言支持:支持超过 29 种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等。

如何使用Qwen2.5?

Qwen2.5既提供了开源模型,也开放了API服务,帮助你快速开发或集成生成式AI功能。

1、开源版本:

开源地址:https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9eGithub:https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file在线demo:https://huggingface.co/spaces/Qwen/Qwen2.5

2、API服务

如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API。

API地址:https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm

Qwen2.5:阿里巴巴最新开源的系列AI大模型

Previous Article

发表回复

Your email address will not be published. Required fields are marked *.

*
*
You may use these <abbr title="HyperText Markup Language">HTML</abbr> tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>