MikuDance是基于扩散模型的动画生成技术,整合混合运动动力学来动画化风格化的角色艺术。MikuDance基于混合运动建模和混合控制扩散技术,解决高动态运动和参考引导错位问题,能显式建模动态相机和角色运动,隐式对齐角色形...
-
-
云锦天章是彩云科技推出的基于DCFormer架构的通用大模型,DCFormer在性能上实现对传统Transformer模型1.7-2倍的提升。云锦天章在虚构的世界观基础上赋予小说人物编程、数学等基础能力,实现高速的文字扩写、...
-
Excalidraw是开源的在线绘图工具,拥有简洁的手绘风格和实时协作功能。Excalidraw完全在浏览器中运行,无需安装,支持多人同时编辑同一张图,提供端到端加密。Excalidraw核心功能包括各种绘图工具、导出为PN...
-
RMBG-2.0是BRIA AI推出的最新开源图像背景移除模型,基于先进的AI技术实现高精度的前景与背景分离,达到SOTA(State of the Art,即当前最佳)水平。RMBG-2.0在性能上超越前代版本,从1.4版...
-
JanusFlow是DeepSeek推出的 Janus 系列,用在多模态理解和生成任务的模型,整合自回归语言模型与校正流技术,在单一模型中实现图像理解和生成。框架基于解耦的视觉编码器和表示对齐策略,提升模型在不同任务上的性能...
-
Text Behind Image是开源的在线工具,支持用户在图片中的角色背后添加文字,创建具有视觉冲击力的海报和社交媒体图像。用户在图像中的主体背后添加自定义文本,并提供文字、字体、颜色、位置、粗细、不透明度、旋转和重复等...
-
SWE-Kit 是Composio 推出的开源框架, 简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具,用于构建自定义编码代理,支持与多种代理框架和大型语言模型集成,降低构建复杂 A...
-
MSQA(Multi-modal Situated Question Answering)是大规模多模态情境推理数据集,提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个问答对,覆盖9个问题类别,基于3D场景...
-
Chonkie是轻量级、快速且功能丰富的RAG(Retrieval-Augmented Generation)分块库,为文本处理设计。Chonkie支持基于Token、单词、句子和语义的多种分块方法,易于安装和使用,无冗余,...
-
Kiroku是多智能体系统,辅助用户组织和撰写文档。灵感源自创始人在斯坦福大学攻读博士期间的学术写作经历,Kiroku模拟学生与导师间的互动,帮助用户快速生成段落、优化沟通方式,在迭代评估中提升信息传递效果。...










