DeepSeek_「夜袭」OpenAI!DeepSeek 开源最强推理模型 R1
今天给各位分享DeepSeek_「夜袭」OpenAI!DeepSeek 开源最强模型 R1,再震欧美同行,其中也会对大家所疑惑的内容进行解释,如果能解决您现在面临的问题,别忘了关注软件站哦,现在开始吧!
2024年1月20日晚,DeepSeek(深度求索)公司正式发布了推理模型 DeepSeek-R1,并同步开源了模型权重。这一举措不仅允许用户免费体验和使用该模型,还鼓励通过模型蒸馏等方式训练其他模型。网友纷纷称赞:“这,才是真正的OpenAI。” 据称,DeepSeek-R1 的能力相当于每月花费200美元的 ChatGPT o1 版本,但却完全免费。
除了开源模型权重外,DeepSeek 还一并发布了详细的「技术报告」,记录了 R1 训练过程中遇到的问题及解决方案,旨在为 AGI 的发展铺平道路。英伟达高级研究科学家 Jim Fan 在阅读这份技术报告后评论道:
“我们生活在这样一个时代:由非美国公司保持 OpenAI 最初的使命——做真正开放的前沿研究、为所有人赋能。这似乎讲不通,但戏剧性的往往最有可能发生。DeepSeek-R1 不仅开源了大量模型,还泄露了所有训练秘密。他们可能是第一个显示 RL(强化学习)飞轮发挥主要作用、持续增长的 OSS 项目。”
DeepSeek-R1 的发布充分展示了其强大的技术实力。首先,它不是期货,而是“发布即上线”,用户现在就可以在 DeepSeek 官网或 App 上体验最新的推理模型 DeepSeek-R1,完全免费。登录 DeepSeek 官网或官方 App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。
DeepSeek-R1 选择了最开放的许可证和用户协议,统一使用 MIT License,并明确支持“模型蒸馏”。DeepSeek 甚至主动示范如何将 R1 作为教师模型来蒸馏出更小但仍有实力的模型,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
开源社联合创始人林旅强表示,开源是最好的“秀技术肌肉”的方式,而 DeepSeek 的透明度和技术报告更是赢得了业界的高度评价。DeepSeek 的目标是通过开放踩过的坑和做过的事情,帮助整个行业更快地达到 AGI。
Twitter 用户盛赞 R1 的实力,纷纷表示其性能比肩 OpenAI o1 正式版,在数学、代码、自然语言推理等任务上表现出色。
从今年开始,DeepSeek 着手开发应用,推出了移动端 AI 助手 DeepSeek App。目前,DeepSeek App 主要提供联网搜索和深度思考功能,虽然尚未针对移动端进行特定功能的打磨,但它为用户提供了在手机上体验最新模型的入口。
一位投资人解释道,DeepSeek 发布 App 是为了补足数据,通过接入用户数据和场景,更好地进行模型能力的迭代和升级。未来,随着 DeepSeek 模型的不断优化,我们可以期待更多惊喜,尤其是在代码模型和应用方面。
总之,DeepSeek 正在以扎实的技术实力和开放的态度,逐步实现赶超 OpenAI 的目标。
以上就是软件站小编给大家带来的DeepSeek_「夜袭」OpenAI!DeepSeek 开源最强推理模型 R1,再震欧美同行全部内容了,希望对小伙伴们有所帮助。
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系删除。(联系邮箱:)