大模型
-
DeepSeek回应崩了:与大规模恶意攻击及服务维护有关
电脑知识网1月30日消息,据报道,有网友在29日晚发现给DeepSeek发送文字聊天消息时,DeepSeek回应称:不好意思,DeepSeek联网搜索服务繁忙,请关闭联网搜索功能,或者稍后再试。
近期,DeepSeek的服务稳定性确实面临了 -
DeepSeek称遭受大规模恶意攻击 注册可能繁忙
电脑知识网1月28日消息,DeepSeek发布最新公告称,近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。
还有媒体报道称,DeepSeek还曾暂时限制了+86手机号以外的注 -
DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI
电脑知识网1月28日消息,爆火的国产大模型DeepSeek又放大招,今天凌晨突然发布Janus-Pro多模态大模型,进军文生图领域。
在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL- -
让美国硅谷恐慌!中国工程院院士揭秘:DeepSeek究竟厉害在哪里
电脑知识网1月17日消息,在AI领域,DeepSeek带来的影响力,一点也不亚于“六代机”。那么,DeepSeek究竟厉害在哪里?
据新浪科技报道,今日,中国工程院院士、清华大学计算机系教授郑纬民指出了DeepSee -
超越国际标准!中国电信AI大模型发布:解决九章算术难题
电脑知识网1月25日消息,中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。该模型采用强化学习训练方法,结合探索和反思范式,显著提升了逻辑推理和数学推导的准确
-
“神秘东方力量”DeepSeek-R1震撼硅谷:创始人采访被“拿放大镜”看
“神秘东方力量”DeepSeek给硅谷带来的影响,还在不断泛起涟漪——
刚刚,DeepSeek-R1跻身大模型竞技榜前三。
以开源、便宜20倍的“身价”与ChatGPT -
华为提出全新压缩算法:节省70%内存占用
电脑知识网1月24日消息,华为AI算法团队在人工智能领域取得了显著突破,他们研究并发表了一种创新的大模型KV Cache压缩算法,名为“RazorAttention”。
这一算法具有卓越的性能,能够有效节省高达70% -
智谱发布电脑智能体大模型GLM-PC:回车即用 协助完成各类电脑任务
电脑知识网1月24日消息,智谱科技近日宣布其最新研发的电脑智能体GLM-PC正式开放体验。
这款基于智谱多模态大模型CogAgent的智能体,是全球首个面向公众开放的电脑智能体,能够模拟人类的“观察”和“ -
业界首款!中国联通发布元景思维链大模型:性能比肩OpenAI
电脑知识网1月24日消息,今日,中国联通宣布,联通数据智能有限公司日前发布元景思维链大模型。
目前,元景思维链模型已在GitHub、魔搭、始智等社区全面开源。
作为央企首个开源的通用思维链大模型,元景思维链大模型既拥有强大慢思考能力,又具备 -
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
电脑知识网1月23日消息,据中国电信,在集团公司统一组织下,中国电信研究院、天翼云、北京电信成功了完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。
通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了50