大模型相关文章列表 - 电脑知识网

权威榜单发布，全球开源大模型前十均为阿里通义千问衍生模型

近日，全球最大AI开源社区Huggingface发布了最新的开源大模型榜单（Open LLM Leaderboard），榜单显示，其排名前十的开源大模型全部是基于阿里通义千问（Qwen）开源模型二次训练的衍生模型。
该榜单是目前全球最具权威

习惯车来车往

2025-02-10

01000

科学动态

DeepSeek无问西东！先行者早已趟平全国产之路

DeepSeek太过火爆，整个国产AI产业都调动起来了！
春节没过完，就已迅速适配多个国产芯片，并在各大云平台上线，好生热闹~
这一系列动向主要聚焦于以下三个方面：
平台层：像华为云、阿里云、腾讯云等云厂商先后接入DeepSeek相关大模型

火车开来了

2025-02-07

0700

科学动态

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！
这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。
在数学和编程能力的评测集上，s1的表现比肩

ps脚踏车つ

2025-02-07

0800

IT业界

李飞飞团队“50美元”复现DeepSeek R1真相：基座曝光

《科创板日报》2月6日讯（记者毛明江黄心怡）今日一则关于人工智能领域的新闻引发广泛关注。
据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。
该模型在数学和编码能

没钱没房没车

2025-02-07

01300

IT业界

DeepSeek网课泛滥专家称普通人没必要购买学习

电脑知识网2月7日消息，近期，国内最火的两个热词，除了“哪吒2”外，就是“DeepSeek”。
据央广网报道，随着DeepSeek的爆火，网络上也出现了大量DeepSeek的网络付费课程，甚至

飞车妹子雄起

2025-02-07

01300

IT业界

月薪8-11万元！DeepSeek招人年薪最高154万

电脑知识网2月5日消息，作为近期在全球爆火的AI企业，随着用户量的激增，DeepSeek也正在不断扩充员工规模。
某招聘平台显示，杭州深度求索人工智能（AI）基础技术研究有限公司即DeepSeek发布了多个岗位的招聘信息。
深度求索公司有5

空格回车

2025-02-05

0500

电脑软件

DeepSeek/o3的弱点找到了！三心二意明明对了又改错了

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。
最新研究揭示：
在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败—

Karter卡丁车手

2025-02-04

01300

科学动态

为什么说大模型补上了搜索的最后一块短板

搜索之战，永不落幕。
2010 年，十年你追我赶，百度谷歌之战，以百度胜利暂时落下帷幕。那时，所有人都以为，全世界范围内的搜索之战，自此落幕，谷歌、百度两大巨头分别占领两大市场，360、 bing 等则依靠搜索产品的带动，分食长尾市场。
没

车水马龙

2025-02-04

01200

科学动态

攻击DeepSeek最薄弱的地方：会出现什么好玩的事情

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。
最新研究揭示：
在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败—

警车法

2025-02-04

0900

IT业界

DeepSeek创始人老家成热门打卡地：家长带着孩子拍照打卡

电脑知识网2月1日消息，据报道，今年春节，近日火爆全球的DeepSeek创始人梁文锋回到家乡——广东省湛江市吴川市覃巴镇米历岭村过年。
梁文锋受到乡民的热烈欢迎，村民在村口拉起横幅，上面写有“热烈欢迎文锋

飞车妹子雄起

2025-02-01

01000

大模型

分享到: