AI工具 - 第16页 - 中国AI网

MikuDance 混合动力动画生成技术，将静态图像生成动态风格化的角色艺术

232

MikuDance是基于扩散模型的动画生成技术，整合混合运动动力学来动画化风格化的角色艺术。MikuDance基于混合运动建模和混合控制扩散技术，解决高动态运动和参考引导错位问题，能显式建模动态相机和角色运动，隐式对齐角色形...

190

云锦天章是彩云科技推出的基于DCFormer架构的通用大模型，DCFormer在性能上实现对传统Transformer模型1.7-2倍的提升。云锦天章在虚构的世界观基础上赋予小说人物编程、数学等基础能力，实现高速的文字扩写、...

275

Excalidraw是开源的在线绘图工具，拥有简洁的手绘风格和实时协作功能。Excalidraw完全在浏览器中运行，无需安装，支持多人同时编辑同一张图，提供端到端加密。Excalidraw核心功能包括各种绘图工具、导出为PN...

233

RMBG-2.0是BRIA AI推出的最新开源图像背景移除模型，基于先进的AI技术实现高精度的前景与背景分离，达到SOTA（State of the Art，即当前最佳）水平。RMBG-2.0在性能上超越前代版本，从1.4版...

217

JanusFlow是DeepSeek推出的 Janus 系列，用在多模态理解和生成任务的模型，整合自回归语言模型与校正流技术，在单一模型中实现图像理解和生成。框架基于解耦的视觉编码器和表示对齐策略，提升模型在不同任务上的性能...

311

Text Behind Image是开源的在线工具，支持用户在图片中的角色背后添加文字，创建具有视觉冲击力的海报和社交媒体图像。用户在图像中的主体背后添加自定义文本，并提供文字、字体、颜色、位置、粗细、不透明度、旋转和重复等...

205

SWE-Kit 是Composio 推出的开源框架，简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具，用于构建自定义编码代理，支持与多种代理框架和大型语言模型集成，降低构建复杂 A...

198

MSQA（Multi-modal Situated Question Answering）是大规模多模态情境推理数据集，提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个问答对，覆盖9个问题类别，基于3D场景...

189

Chonkie是轻量级、快速且功能丰富的RAG（Retrieval-Augmented Generation）分块库，为文本处理设计。Chonkie支持基于Token、单词、句子和语义的多种分块方法，易于安装和使用，无冗余，...

196

Kiroku是多智能体系统，辅助用户组织和撰写文档。灵感源自创始人在斯坦福大学攻读博士期间的学术写作经历，Kiroku模拟学生与导师间的互动，帮助用户快速生成段落、优化沟通方式，在迭代评估中提升信息传递效果。...