科普第16页 - 中国AI网

GenMAC 港大、清华联合微软推出文本到视频生成的多代理协作框架

164

GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架，用在解决文本到视频生成中的复杂场景生成问题。基于将任务分解为设计、生成和重新设计三个阶段，在生成与重新设计之间建立迭代循环，逐步验证和优化视频内容。...

189

SPDL（Scalable and Performant Data Loading）是 Meta AI 推出的开源数据加载工具，能提高 AI 模型训练效率。基于多线程技术，实现高吞吐量数据加载，减少计算资源消耗。与传统基于进...

404

Amurex是AI会议助手，基于实时建议、智能摘要、关键要点提取、迟到加入回顾和完整会议记录等功能，帮助用户提升会议效率。作为开源工具，Amurex强调透明度、安全性和隐私保护，让用户对数据的处理更放心。...

170

See3D（See Video, Get 3D）是北京智源人工智能研究院推出的3D生成模型，能基于大规模无标注的互联网视频进行学习，实现从视频中生成3D内容。与传统依赖相机参数的3D生成模型不同，See3D采用视觉条件技术，...

195

CausVid是Adobe和MIT共同推出的自回归实时视频生成技术，能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型，减少视频生成的延迟，首帧延迟仅1.3秒，生成速度达到9.4帧/秒。CausVid突破...

213

Willow 量子芯片是谷歌最新推出的具有105个物理量子比特，在量子纠错和计算效率上取得了显著突破。Willow成功解决了量子计算领域近30年的纠错难题，实现了在增加量子比特数量的同时，显著降低错误率。...

200

Florence-VL是创新的多模态大型语言模型（MLLMs），是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉表示，能捕捉图像的不同层次和方面的视觉特征，适应多样的...

724

OOTDiffusion是开源的AI虚拟试衣工具，能智能适配不同性别和体型，自动调整衣物尺寸和形状，生成自然贴合的试穿效果。OOTDiffusion支持半身和全身试穿模式，用户上传自己的模特和服装图片，实现高度自定义的试穿体...

247

O1-CODER是北京交通大学研究团队推出的开源项目，旨在复制OpenAI的O1模型，专注于编码任务。O1-CODER结合强化学习（RL）和蒙特卡洛树搜索（MCTS）技术，提升模型的System-2思维能力，更谨慎、逻辑和逐...

288

SOLAMI是创新的VR端3D角色扮演AI系统，是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动，基于社交视觉-语言-行为模型，提供超越传统文本和语音交互的自然交流体验。...