网站首页 > AI工具 第5页
  • Find3D  加州理工学院推出的3D部件分割模型

    Find3D 加州理工学院推出的3D部件分割模型

    170

    Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自动从互联网上的3D资产生成训练数据,并用对比训练方法训练一个可扩展的3D模型。...

  • Optima  清华联合北邮推出优化通信效率和任务有效性的训练框架

    Optima 清华联合北邮推出优化通信效率和任务有效性的训练框架

    249

    Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果。Optima平衡了任务性能、令牌效率和通信可读性,探索了多种强化...

  • MuCodec  清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器

    MuCodec 清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器

    252

    MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学的研究人员共同推出的超低比特率音乐编解码器,能实现音乐的高效压缩与高保真重建。MuCodec基于MuEncoder提取音乐的声学和语义特征,用RVQ技术进...

  • SmolVLM  Hugging Face推出的轻量级视觉语言模型

    SmolVLM Hugging Face推出的轻量级视觉语言模型

    210

    SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求:SmolVLM-Base:适用于下游任务的微...

  • ebook2audiobookXTTS  开源电子书转有声书 AI 工具,支持16种语言

    ebook2audiobookXTTS 开源电子书转有声书 AI 工具,支持16种语言

    273

    ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pdf、mobi等,用Coqui XTTS技术实现高质量的文本到语音转换。...

  • OneDiffusion  无缝支持双向图像合成和理解的开源扩散模型

    OneDiffusion 无缝支持双向图像合成和理解的开源扩散模型

    187

    OneDiffusion是AI2推出的多功能大规模扩散模型,能无缝支持双向图像合成和理解,涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目标图像建模为序列“视图”训练,实现在推理时任意帧作为条件图像的...

  • OpenScholar  华盛顿大学联合艾伦研究所开源的学术搜索工具

    OpenScholar 华盛顿大学联合艾伦研究所开源的学术搜索工具

    171

    OpenScholar是华盛顿大学和艾伦AI研究所共同推出的检索增强型语言模型(LM),能帮助科学家基于检索和综合科学文献中的相关论文回答问题。系统用大规模的科学论文数据库,用定制的检索器和重排器,及一个优化的8B参数语言模...

  • LongAlign  港大推出的提升文本到图像扩散模型处理长文本对齐方法

    LongAlign 港大推出的提升文本到图像扩散模型处理长文本对齐方法

    191

    LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongAlign用段级编码技术,将长文本分割处理,适应编码模型的输入限制。同时引入分解偏好优化,基于区分偏好模型...

  • Teacher2Task  谷歌推出的多教师学习框架

    Teacher2Task 谷歌推出的多教师学习框架

    168

    Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N+1个任务,包括N个辅助任务预测每位教师的标记风格,及一...

  • CAMPHOR  苹果推出的端侧小语言模型多智能体框架

    CAMPHOR 苹果推出的端侧小语言模型多智能体框架

    251

    CAMPHOR是苹果团队推出的端侧小语言模型(SLM)多智能体框架,能提升移动设备的隐私保护和响应速度。框架基于在设备本地处理多个用户输入并进行个人上下文推理,确保用户隐私安全。CAMPHOR基于分层架构,其中高阶推理智能体...

1 2 3 4 5 6 7 8 9 10
返回顶部 暗黑模式