阿里云开源通义千问Qweb2 支持128K上下文 在测试中表现不俗 – 蓝点网
#人工智能 阿里云推出通义千问 Qwen2 系列模型,阿里完全开源,云开源通义千提供 0.5B~72B 之间 5 个版本,问Q文测网在各项评测中表现不俗。上下试中有兴趣的表现不俗开发者现在就可以通过 GitHub 等平台获取最新模型。查看全文:https://ourl.co/104358
阿里云今天推出了通义千问人工智能模型的蓝点重大升级版本:Qwen2,该模型提供 5 个不同的阿里尺寸、上下文长度最高支持 128K tokens,云开源通义千并且在各项测试中表现不俗。问Q文测网
Qwen2 的上下试中所有尺寸版本均已同步在 GitHub、HuggingFace 和 ModelScope 上开源,表现不俗有兴趣的蓝点开发者可以立即获取模型进行测试。
此次发布的阿里新版本亮点包括:
- 能力较此前版本有较大幅度提升,在开源模型测试中名列前茅
- 提供 5 个预训练和指令微调模型,云开源通义千包括 Qwen2-0.5B、问Q文测网Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B
- 在编程领域和数学方面的能力显著提高
- 增加上下文长度,现在最高支持 128K tokens
- 在中文和英语的基础上,增加 27 种语言相关的数据进行训练
在 Qwen1.5 系列模型中只有 32B 和 110B 版使用 GQA,而在 Qwen2 中所有模型都使用 Qwen2,使用 GQA 后有助于提升推理能力和降低显存的占用。
同时诸如 Qwen2-0.5B 和 1.5B 版可以在性能更低的设备上运行,例如在智能手机本地运行 Qwen2-0.5B 而不需要云端处理,这种也是未来的趋势,未来可能所有智能设备都会支持 AI,这就需要更小的模型为本地运行提供支持。
模型评估显示 Qwen2 能力超过 Llama3:
目前人工智能开源 / 开放社区中最重要的两个贡献者就是 Meta 和阿里云,Meta 主要就是 Llama 系列模型最新版本为 Llama3。
在开源 / 开放模型能力评测中,Qwen2-72B 版在各方面超过 Llama3-70B,也超过了 Mixtral-8x22B,所以现在压力给到了 Meta,不知道 Meta 什么时候发布新版本。
阿里云 AI 团队表示:
大规模预训练后,我们对模型进行精细的微调,以提升其智能水平,让其表现更接近人类。这个过程进一步提升了代码、数学、推理、指令遵循、多语言理解等能力。此外,模型学会对齐人类价值观,它也随之变得更加对人类有帮助、诚实以及安全。我们的微调过程遵循的原则是使训练尽可能规模化的同时并且尽可能减少人工标注。我们探索了如何采用多种自动方法以获取高质量、可靠、有创造力的指令和偏好数据,其中包括针对数学的拒绝采样、针对代码和指令遵循的代码执行反馈、针对创意写作的回译、针对角色扮演的 scalable oversight、等等。在训练方面,我们结合了有监督微调、反馈模型训练以及在线 DPO 等方法。我们还采用了在线模型合并的方法减少对齐税。这些做法都大幅提升了模型的基础能力以及模型的智能水平。
限时活动推荐:软购618多款正版软件2折购、QQ超会15月108元、B站大会员88元、腾讯视频128元、爱奇艺138元。
-
文章
84763
-
浏览
43348
-
获赞
9
热门推荐
-
GIVERNY姿泊兰伊宣告品牌睁开三大策略 助力品牌周全降级
韩国业余底妆品牌GIVERNY姿泊兰伊自2009年建树至今,不断专一底妆品类的研发立异规模,凭仗与此外底妆品牌差距的新潮妆色及质感、简洁而不易的气焰,全新解读裸妆时尚潮水意见,在业内以及破费者间皆具备3DS新游《元气史莱姆3》冬季上市
近日,史艾SQUARE ENIX)公布了旗下最新3DS作品《元气史莱姆3:大海盗与尾巴团》,计划在今年冬季正式与玩家见面。在《元气史莱姆》系列里,勇者斗恶龙的标志性魔物——史莱姆将会化身成为主角、开展伊藤润二画风恐怖游戏《恐怖世界》Steam推出先行体验版
伊藤润二画风恐怖游戏《恐怖世界》Steam推出先行体验版2023-08-22 09:52:08编辑:Reset 伊藤润二是《航海世纪》浪漫七夕火热开启!海量好礼共度佳节
《航海世纪》浪漫七夕火热开启!海量好礼共度佳节2023-08-22 11:53:51编辑:Reset 《航海世纪》浪漫七夕一个公式解读小米营销的'拉活'秘籍
增量市场的逐渐饱以及早已经不是别致话题。2019年,中国挪移互联网用户规模11.35亿,增幅跌破1%,用户削减根基饱以及。削减的困局也已经从纯挚的"获客"转变为若何"拉活2K:回合制已经不适合当代
近日,2K总裁在接受采访时明确表示:回合制已经不适合当代。而相信我们从《仙剑1》玩到《仙剑5》还是还是回合制,不禁悲从中来。。。去年,2K Games公布,他们将把很多年前风靡一时的回合制策略游戏《幽恋与制作人游乐场扮鬼事件完场攻略[图]
人玩家进行新闻调查来获得课程提升公司的能力,新闻事件很多,不少小伙伴正在进行游乐场扮鬼事件的调查,今天小编就为各位玩家带来恋与制作人游乐场扮鬼事件完场攻略,一起来看看吧。恋与制作人游乐场扮鬼事件怎么选《仙剑奇侠传5》卸载问题官方声明
《仙剑奇侠传5》正式发售之后,赢得众多玩家的反响,当然有褒有贬。最近北京软星接到部分玩家反映《仙剑5》卸载游戏时候会出现问题,并发布了官方声明,原文如下:随着仙剑5游戏的正式发售,有些问题也随之而来,LAVER莱薇尔身段美白泥的美白成果临床下场陈说
LAVER莱薇尔身段美白泥的美白成果临床下场陈说本文导读:关键词:美白泥;身段美白;人体试验;美白成果测评1 引言常言道“一白遮三丑”,亚洲女性对于美白的谋求就像人类对于黝黑的谋求同样从未停止,胭脂水炉石传说你母亲是个好人任务完成攻略
炉石传说你母亲是个好人任务完成攻略发布时间:2022-11-03 15:38:22来源:逗游作者:清羽炉石传说卡牌对战卡牌策略炉石传说游戏类别:卡牌对战游戏大小:119.82M 游戏语言:简体中文游戏《战国BASARA:编年史英雄》获Fami通33分高评价
今日,Fami通公开了预.........定在7月21日发售的PSP游戏《战国BASARA:编年史英雄》的评分:9 / 8 / 8 / 8,总分33分,成功进入金殿堂。本作除了会追加新武将、新游戏模式韩国coser挑战《EVE》女神凌波丽首页
近日,韩国cosplay团体为大家带来了一组《EVE》凌波丽女神的cos。女神凌波丽,大家不会陌生吧,小编也就不介绍了。至于这位cos凌波丽的名为Tomia的成员,小编只能歉意的说一句,你尽力了。12大中华区艾菲与京东批发达成策略相助,助力购物者营销实效降级
5月12日,大中华区艾菲奖购物者营销专项专委会在京召开,开启商业规模的新篇章。该专项种别面向传统批发渠道以及电子商务规模,征集购物者营销实效的营销案例作品,进而赋能中国商业营销规模的立异实际。专委会的开放世界动作冒险游戏《红色沙漠》新实机预告公布
开放世界动作冒险游戏《红色沙漠》新实机预告公布2023-08-23 09:52:06编辑:Reset 游戏作为讲述佣兵们的汉字神操作臭找出18个字攻略分享
汉字神操作臭找出18个字攻略分享发布时间:2022-11-02 16:58:54来源:逗游作者:逗游网汉字神操作汉字找茬游戏汉字解谜有趣的汉字游戏游戏类别:休闲益智游戏大小:1.27M 游戏语言:简体