• DynaSaur  Adobe 推出的大语言模型代理框架

    DynaSaur Adobe 推出的大语言模型代理框架

    167

    DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成和执行Python代码与环境互动,实现更灵活的问题...

  • Edify 3D  NVIDIA 推出的3D生成模型

    Edify 3D NVIDIA 推出的3D生成模型

    160

    Edify 3D 是 NVIDIA 推出的先进3D资产生成方案,能从文本提示或参考图像快速合成高质量的3D模型。Edify 3D能在两分钟内生成具有详细几何形状、清晰拓扑结构、高分辨率纹理和PBR材质的3D资产,支持视频游戏...

  • XGrammar  陈天奇团队推出的LLM结构化生成引擎

    XGrammar 陈天奇团队推出的LLM结构化生成引擎

    203

    XGrammar是由陈天奇团队推出的开源软件库,能为大型语言模型(LLM)提供高效、灵活且可移植的结构化数据生成能力。基于上下文无关语法(CFG)定义结构,支持递归组合以表示复杂结构,适合生成JSON、SQL等格式数据。XG...

  • LongRAG  智谱联合清华和中科院推出的双视角鲁棒检索框架

    LongRAG 智谱联合清华和中科院推出的双视角鲁棒检索框架

    178

    LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架。基于混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器四个组件,有效解决长文本问...

  • Illustrious  开源文本到图像生成模型,专注于生成高质量动漫风格图像

    Illustrious 开源文本到图像生成模型,专注于生成高质量动漫风格图像

    353

    Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法,实现高分辨率、动态色域和高还原能力的图像生成。模...

  • aisuite  吴恩达发布开源Python库,一个接口调用多个大模型

    aisuite 吴恩达发布开源Python库,一个接口调用多个大模型

    250

    aisuite是开源的Python库,吴恩达(Andrew Ng)发布的,旨在提供一个统一的接口来调用多个大型语言模型(LLM)服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台,开发者能轻松切...

  • Pangea  卡内基梅隆大学开源的多语言多模态大语言模型

    Pangea 卡内基梅隆大学开源的多语言多模态大语言模型

    221

    Pangea是卡内基梅隆大学团队推出的多语言多模态大型语言模型(LLM),能提升全球语言和文化多样性的覆盖。模型包含600万条指令的多样化数据集,支持39种语言,包含高质量英文指令、机器翻译指令及文化相关任务。Pangea基...

  • MobA  上海交通大学推出的移动智能体

    MobA 上海交通大学推出的移动智能体

    197

    MobA(Mobile Agent)是上海交通大学团队推出的新型移动智能体,基于多模态大型语言模型(MLLMs)提升移动设备的自动化任务执行能力。MobA采用两级架构:高级全局智能体(GA)负责理解用户指令、管理历史记录和规...

  • Fugatto  英伟达推出的多功能AI音频生成模型

    Fugatto 英伟达推出的多功能AI音频生成模型

    207

    Fugatto是英伟达(NVIDIA)推出的音频合成和转换模型,全称为"Foundational Generative Audio Transformer Opus 1"。模型能根据文本提示生成音频或视频...

  • Frames  Runway 推出的AI图像生成模型

    Frames Runway 推出的AI图像生成模型

    190

    Frames是Runway推出的最新AI图像生成模型,在风格控制和视觉保真度方面取得巨大进步。Frames能维持风格一致性,支持广泛的创意探索,为项目建立特定外观,并生成符合用户美学的变体。基于Frames,用户能精确设计想...

22 23 24 25 26 27 28 29 30 31
返回顶部 暗黑模式