大模型
-
权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型
近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。
该榜单是目前全球最具权威 -
DeepSeek无问西东!先行者早已趟平全国产之路
DeepSeek太过火爆,整个国产AI产业都调动起来了!
春节没过完,就已迅速适配多个国产芯片,并在各大云平台上线,好生热闹~
这一系列动向主要聚焦于以下三个方面:
平台层:像华为云、阿里云、腾讯云等云厂商先后接入DeepSeek相关大模型 -
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!
这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。
在数学和编程能力的评测集上,s1的表现比肩 -
李飞飞团队“50美元”复现DeepSeek R1真相:基座曝光
《科创板日报》2月6日讯 (记者 毛明江 黄心怡) 今日一则关于人工智能领域的新闻引发广泛关注。
据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。
该模型在数学和编码能 -
DeepSeek网课泛滥 专家称普通人没必要购买学习
电脑知识网2月7日消息,近期,国内最火的两个热词,除了“哪吒2”外,就是“DeepSeek”。
据央广网报道,随着DeepSeek的爆火,网络上也出现了大量DeepSeek的网络付费课程,甚至 -
月薪8-11万元!DeepSeek招人年薪最高154万
电脑知识网2月5日消息,作为近期在全球爆火的AI企业,随着用户量的激增,DeepSeek也正在不断扩充员工规模。
某招聘平台显示,杭州深度求索人工智能(AI)基础技术研究有限公司即DeepSeek发布了多个岗位的招聘信息。
深度求索公司有5 -
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。
最新研究揭示:
在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败— -
为什么说大模型 补上了搜索的最后一块短板
搜索之战,永不落幕。
2010 年,十年你追我赶,百度谷歌之战,以百度胜利暂时落下帷幕。那时,所有人都以为,全世界范围内的搜索之战,自此落幕,谷歌、百度两大巨头分别占领两大市场,360、 bing 等则依靠搜索产品的带动,分食长尾市场。
没 -
攻击DeepSeek最薄弱的地方:会出现什么好玩的事情
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。
最新研究揭示:
在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败— -
DeepSeek创始人老家成热门打卡地:家长带着孩子拍照打卡
电脑知识网2月1日消息,据报道,今年春节,近日火爆全球的DeepSeek创始人梁文锋回到家乡——广东省湛江市吴川市覃巴镇米历岭村过年。
梁文锋受到乡民的热烈欢迎,村民在村口拉起横幅,上面写有“热烈欢迎文锋