【khajana matka result】智谱 AI 开源视频理解模型 CogVLM2
感谢IT之家网友 USER 的智谱线索投递!
IT之家 7 月 12 日消息,开源智谱 AI 宣布,视频khajana matka result训练了一种新的理解视频理解模型 CogVLM2-Video,并将其开源。模型
据介绍,智谱当前大多数的开源视频理解模型使用帧平均和视频标记压缩方法,导致时间信息的视频丢失,无法准确回答与时间相关的理解问题。一些专注于时间问答数据集的模型khajana matka result模型过于局限于特定格式和适用领域,使得模型失去了更广泛的智谱问答能力。
▲ 官方效果演示智谱 AI 提出了一种基于视觉模型的开源自动时间定位数据构建方法,生成了 3 万条与时间相关的视频视频问答数据。基于这个新数据集和现有的理解开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,模型训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。
IT之家附相关链接:
代码:https://github.com/THUDM/CogVLM2
项目网站:https://cogvlm2-video.github.io
在线试用:http://36.103.203.44:7868/
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
(责任编辑:百科)
最新内容
- ·大漠深处:金戈铁马起风雷
- ·权威专家:长债利率很低情况下,央行进一步降息受限
- ·宝马中国回应退出价格战传闻:支持经销商稳扎稳打
- ·必玩文字冒险游戏:探索剧情与解谜双重体验
- ·Local authorities accelerate development of solar power industry in Hami City, NW China
- ·探索2024年免费文字游戏世界
- ·瑞典游戏公司Embracer集团完成6亿欧元信贷融资
- ·宝能系高管入驻众泰汽车,占据多个关键岗位
- ·Fish migrate to spawning grounds at Port Hope, Canada
- ·探索2024年最激动人心的免费文字冒险游戏
热点内容
- ·China's energy transition: Developing new quality productive forces in energy sector
- ·《巫师3》官方发布联动周边 合味道x 赛博朋克x U.F.O.
- ·养成锻炼习惯 提升身体素质 儿童青少年暑假运动正当时
- ·海南实施工程建设项目审批制度改革提高项目审批效能
- ·Chinese premier holds talks with Spanish prime minister
- ·央行:上半年人民币贷款增加13.27万亿元
- ·2024年免费文字冒险游戏:专业评测与推荐
- ·《巫师3》官方发布联动周边 合味道x 赛博朋克x U.F.O.
- ·In pics: Chinese exhibitors at IFA Berlin 2024
- ·2024年文字单机游戏:专业评测与推荐