科普第20页 - 中国AI网

EfficientTAM Meta AI推出的视频对象分割和跟踪模型

213

EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型，能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transformer（ViT）作为图像编码器，并引入高...

194

GPT学术优化（GPT Academic）是功能丰富的开源项目，专为学术研究和写作设计。GPT学术优化集成一键论文翻译、源代码解析、互联网信息获取、Latex文章校对、论文润色和摘要生成等多项实用功能。GPT学术优化采用模块...

233

HunyuanVideo是腾讯开源的视频生成模型，拥有130亿参数，是目前参数量最大的开源视频模型之一。HunyuanVideo具备物理模拟、高文本语义还原度、动作一致性和电影级画质等特性，并能生成带有背景音乐的视频。...

173

Codel是全自主AI代理工具，能在沙盒化的Docker环境中执行复杂任务和项目。Codel具备自主操作能力，内置浏览器和文本编辑器，所有操作记录存储于PostgreSQL数据库。Codel能自动完成复杂任务，如创建项目结构...

444

Lobe Vidol是开源的数字人创作平台，让每个人都能轻松创建和互动自己的虚拟偶像。Lobe Vidol提供流畅的对话体验、背景设置、动作姿势库、优雅的用户界面、角色编辑、MMD舞蹈支持、PMX舞台加载、触摸响应功能及角色...

242

MVGenMaster是复旦大学、阿里巴巴达摩院和湖潘实验室共同推出的多视图扩散模型，基于增强3D先验处理多样化的新视角合成（NVS）任务。模型基于度量深度和相机姿态扭曲的3D先验，提升NVS的泛化和3D一致性。...

230

HiFiVFS（High Fidelity Video Face Swapping）是腾讯和VIVO公司推出的高保真视频换脸框架，HiFiVFS基于Stable Video Diffusion（SVD）框架，用多帧输入和时间...

206

360Zhinao2-7B是360自研的AI大模型360智脑7B参数升级版，涵盖基础模型及多种上下文长度的聊天模型。360Zhinao2-7B模型是继360Zhinao1-7B之后的重要更新，基于采用全新的多阶段训练方式和更...

600

AnchorCrafter是基于扩散模型的智能视频制作系统，用在自动生成具有高保真度的主播风格产品推广视频。基于整合人-物交互（HOI）到姿态引导的人体视频生成中，实现对物体外观和运动控制的高度还原，及对复杂人物-物体交互的...

309

MyTimeMachine（MyTM）是先进的个性化面部年龄转换技术，基于大约50张个人照片，跨越20至40年的时间跨度，训练一个适配器网络个性化预训练的全局老化模型。MyTimeMachine能实现高质量的年龄回退和年龄进...