DeepSeek是啥_杭州一家公司,突然爆火!今天所有人都在讨论的“DeepSe
DeepSeek是啥_杭州一家公司,突然爆火!今天所有人都在讨论的“DeepSeek”,究竟是啥?最近引发大家的关注,相信大家都想知道这件事会有怎么样的发展?下面就让小编为大家介绍一下,一起来看看吧。
1月27日,DeepSeek 应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek 成为中国区第一。
1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥对DeepSeek 评价道:“这可能是一个国运级别的科技成果。” 冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家专注于开发先进大语言模型(LLM)及相关技术的创新型科技公司。
去年12月,DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
DeepSeek之所以能够出圈,很大程度上得益于其2024年12月26日宣布上线并同步开源的DeepSeek-V3模型。这款模型不仅在性能上超越了GPT-4o,还在成本控制上表现出色。DeepSeek-V3仅用了1/11的算力、约2000个GPU芯片,训练出性能超越GPT-4o的大模型,总训练成本仅为557.6万美元,而GPT-4o的训练成本约为1亿美元,使用了25000个GPU芯片,双方的成本差距达到了10倍之多。
在性能方面,DeepSeek-V3在数学、代码能力和中文知识问答方面超过了ChatGPT-4o。国外独立测评机构Artificial Analysis测试后,发出了“超越了迄今为止所有开源模型”的惊叹;Meta科学家田渊栋感慨:“这是非常伟大的工作。”
此外,“性价比”是商业社会中的制胜法宝之一,DeepSeek也因此被称为“大模型界的拼多多”,引发了字节、阿里、百度等大厂的大模型价格大战。
DeepSeek团队只有139名研发人员,相比OpenAI拥有1200名研究人员,团队规模是DeepSeek的近9倍。其中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人。比如前段时间的热门线后天才AI少女”,这位“95后AI天才少女”罗福莉就是DeepSeek开源大模型DeepSeek-V2的关键开发者之一。
OpenAI前政策主管、Anthropic联合创始人Jack Clark曾评价DeepSeek:“雇用了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。”
梁文锋,80后,出生于广东的一个五线城市,父亲是一名小学老师。他毕业于浙江大学,主修软件工程,人工智能方向。17岁时,梁文锋考入浙大,读的是电子工程系人工智能方向,毕业后继续在浙大攻读硕士研究生,论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。
2015年,30岁的梁文锋和朋友一起创办了杭州幻方科技有限公司,立志成为世界顶级的量化对冲基金。2016年10月,幻方量化推出了第一个AI模型,第一份由深度学习生成的交易仓位上线年底,几乎所有的量化策略都采用AI模型计算。
2023年5月,38岁的梁文锋宣布进军通用人工智能(AGI)。同年7月,他正式创办了杭州深度求索人工智能基础技术研究有限公司,即DeepSeek公司,专注于AI大模型的研究和开发,公司设在杭州。
有同事评价梁文锋:完全不像一个老板,而更像一个极客。作为老板,他本人每天都在写代码、跑代码,学习能力惊人。从公开的工作经历和职业生涯来看,梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验,创业范畴横跨金融和人工智能领域。
26日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到“服务器繁忙”的提示。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。
今天也有消息称,DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。对于DeepSeek如何看待“两天两崩”,DeepSeek回复称,技术服务的稳定性受多重因素影响,可能涉及突发流量、系统升级适配或底层基础设施的临时波动等。我们的团队始终将稳定性作为首要任务,并会在每次事件后彻底分析原因,持续优化系统韧性。
总之,DeepSeek凭借其创新的技术和卓越的性价比,迅速赢得了全球的关注和认可。未来,这家公司将继续在AI领域探索更多可能性,为全球用户提供更优质的AI服务。
上述就是关于DeepSeek是啥_杭州一家公司,突然爆火!今天所有人都在讨论的“DeepSeek”,究竟是啥?的全部内容了,希望能够有所帮助。更多相关攻略和资讯可以关注我们资讯频道,之后将为大家带来更多精彩内容。
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系删除。(联系邮箱:)