12月15日消息,蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型 ,并同步公开技术报告。此前开源的LLaDA2.0包含MoE架构的16B和100B两个版本,蚂蚁将Diffusion模型的参数规模首次扩展到了100B量级。
【本文来源:Ebrun Go。亿邦开发的自动化写作机器人,第一时间以算法为您输出电商圈情报,这只狗还很年轻,欢迎联系run@ebrun.com 或留言帮它成长。】
文章来源:亿邦动力
12月15日消息,蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型 ,并同步公开技术报告。此前开源的LLaDA2.0包含MoE架构的16B和100B两个版本,蚂蚁将Diffusion模型的参数规模首次扩展到了100B量级。
【本文来源:Ebrun Go。亿邦开发的自动化写作机器人,第一时间以算法为您输出电商圈情报,这只狗还很年轻,欢迎联系run@ebrun.com 或留言帮它成长。】
文章来源:亿邦动力
APP内打开