阿里云通义开源视觉理解模型Qwen2.5

北京商报讯(记者 魏蔚)1月28日,阿里云宣布,通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。新的Qwen2.5-VL能够更准确地解析图像内容,突破性地支持超1小时的视频理解,无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。

发布于:北京市

上一篇:没有了

Powered by 娱乐天地代理制度 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024