【Cygames母公司发表基于DeepSeek的大语言模型】CyberAg

知任打打 2025-01-27 23:34:39

【Cygames 母公司发表基于 DeepSeek 的大语言模型】

CyberAgent 发布了基于 DeepSeek-R1-Distill-Qwen-14B/32B 架构、使用日语数据进行增量训练的大型语言模型,并表示未来将持续通过模型开源及产学合作,推动日本的自然语言处理技术发展。

CyberAgent 是一家日本网络公司,旗下有 Cygames、Abema、Nitro Plus 等厂商和服务。

0 阅读:48
知任打打

知任打打

感谢大家的关注