No menu items!

    admin

    10376 帖子

    3万张卡、60亿投入后,DeepSeek发了5000亿红包(图)

    img { height: 264.31718061674px;width:600px;}img { height: 350.87719298246px;width:600px;}img { height: 326.08695652174px;width:600px;}img { height: 245.90163934426px;width:600px;}img { height: 344.8275862069px;width:600px;}DeepSeek在春节期间的惊艳表现,成为中、美科技竞争的新变量。在技术方面,DeepSeek成功地摸索出了一套在“算力受限”的条件下,提升算力效率、实现大模型性能大幅跃升的路径;对行业而言,DeepSeek自信地用开源的方式赋能各行各业;而对用户来说,其免费商业模式也意外地推动了“AI技术平权”和“AI普惠”。DeepSeek在全球AI产业掀起的技术、资本风暴,伴随而来的是企业和用户们疯狂涌入带来的“泼天”流量。朱嘉明教授在腾讯科技的《AGI之路系列直播》里曾提到,人工智能未来的发展将会出现分叉:一种是更前沿、尖端、高成本的路线,旨在研究人类未知的领域;一种是走向低成本、大规模的大众化路线,DeepSeek就是这种大众路线的最佳践行者——他们不仅选择了大众路线,也想把更多的人带上这条路。相比出圈爆火,DeepSeek做了一件更值得被记录在大模型开源史上的事情——通过连续五天的发布,将其一路走来的方法论、“武功秘籍”公之于人,这其中包括:开源针对Hopper架构GPU(例如H100或H800)加速MLA机制计算的FlashMLA内核开源加速MoE模型高效通信和并行处理,实现H800带宽翻倍的DeepEP代码库开源采用CUDA编写,适用于矩阵和MoE模型计算,支持FP8精度的高性能通用矩阵乘法库DeepGEMM开源V3/R1训练中采用的计算与通信重叠的双向管道/流水线并行算法DualPipe,用以提升资源利用率开源利用SSD和RDMA网络带宽设计的并行文件系统3FS文件系统,用以提升模型训推效率现在,我们完全可以将DeepSeek称之为 “OpenSeek” 。DeepSeek“开源五日”这套动作,给外界的观感是将CUDA、Hopper架构吃透了,甚至可以说DeepSeek的工程师,可能比英伟达的多数研究员更懂CUDA和Hopper,但相关研究的本质还是因为“算力受限”与成本高企。那么问题来了,春节之后的这段时间,DeepSeek在用户和市场份额上的走势如何,其算力现状是什么,他们究竟需要什么量级的算力,资本支出在什么量级,会给产业上下游带来什么样的机会?01、DeepSeek接入潮的负效应:移动端日活减半根据SensorTower数据,截至2025年2月24日,DeepSeek移动端近30天的平均日活为950万,2月24日日活接近700万,对比2月初1500万的峰值数据,数据接近砍半。日活用户大幅度减少,与过去一段时间越来越多的终端厂商、云厂以及企业私有化部署所组成的“接入潮”有关。此前,由于用户扎堆导致DeepSeek官方服务频繁异常,第三方接入后,大量用户被分流至外部场景当中。但同时,低频用户的热情逐渐消退,也是DeepSeek月活下降的一个重要原因。所以,在多数对大模型感兴趣的人都已下载的情况下,到2月24日,DeepSeek的日下载量下滑至75万左右。相比之下,1月28日,DeepSeek在移动端创下了531万的峰值记录。面对如此的流量下滑之势,DeepSeek的未来是否值得担心?答案是否定的。如果DeepSeek担心用户分流而反噬自己,就不会选择开源核心模型和硬件效率提升的相关方法论,也更不会在行业里率先发起降价潮,你看最近他们又开始降价了,至少现在看,流量变现不是其最核心的目标。当然,还要考虑另一重因素,我们所看到的流量下滑只是移动端趋势的反应,一是网页端、API接入的数据没有披露,二是用户使用频次这类更细分的数据还未可知。02、2000万日活的入场券:预估需要2.78万张GPU相对其他同尺寸的稠密模型,DeepSeek R1模型的DeepSeekMoE+MLA(多头注意力)架构具备显著成本优势。单Token激活参数仅37B(670B全参数的5.5%),KV Cache对显存的需求,降低至传统架构的1/3~1/15,理论上显存只需要14GB,而H800和A800这些特供版的显存都是80GB。注:KV Cache:将需要重复计算的结果进行缓存,需要缓存的值为历史token对应的KV值,用以避免重复计算。另外,DeepSeek R1/V3还采用了8位(而不是16位的格式)的FP8数据格式,使得所需的显存进一步减少。具体到部署方面,除了常见的IDC集群部署外,业界也为DeepSeek提供了开源的经济型部署方案。例如清华KTransformers团队针对参数存储进行优化,使用单卡4090运行压缩版671B DeepSeek。所以,这段时间很多人在谈论大众层面的“AI技术平权”,实际上在行业层面,DeepSeek以及清华KTransformers这样的外部团队的探索,以及陆续的开源动作,也可以归结为一种由算力瓶颈驱动的算法平权。前面提到,DeepSeek移动端大概950万,如果网页端+API也按照这个数据计算(实际上从办公的角度看,web端流量应该更高),保守一点,我们假设其日活2000万,那么这个量级的流量,需要多少模型,需要多少算力?我们假设平均每个用户每天10次问答,单次平均消耗10秒钟,即1/8640天,这意味着2000万日活对应的单日推理请求总计2亿次,如果排队的话,总耗时为2亿×1/8640,即1个模型跑23148天,显然这种策略不合理,但可以换一种理解方式,部署23148个模型并行跑1天。考虑到推理集群、时差等因素需要设置一定量的冗余,在23148个模型的基础上,取1.2作为系数估算(实际系数与服务和客户活动曲线有关),即实际部署的并行模型数约为2.78万。回到模型本身,DeepSeek R1模型一共有256个专家,根据用户群的需求动态调整细粒度专家的分布,这意味需要同时运行2.78万个DeepSeek...

    川普是否支持北约「还在思考」:不付钱就不协防

    川普总统今天再度表示,他还在思考要不要支持北大西洋公约组织(NATO),并说没有适当支出军费的国家,就不应获得防卫。 川普告诉媒体:「如果他们不付钱,我就不会协防他们。」 var admarutag = admarutag || {} admarutag.cmd = admarutag.cmd || admarutag.cmd.push(function() { admarutag.pageview('1aa64996-806f-4094-8fce-923b967576ed'); }); 法新社报导,川普经常质疑,美国是否应该继续在北约扮演内核角色。美国是这个跨大西洋联盟中规模最大的军事力量,且自二战以来一直是欧洲安全的终极保障者。 今年1月展开第2个总统任期的共和党人川普进一步批评北约成员国在防卫预算支出不够多,而且过度依赖美国。 他说:「他们应该付更多钱。」 川普对记者发表的这番言论是在回应美国国家广播公司新闻网(NBC News)今天稍早的报导。这篇报导指出,川普正在考虑一项调整美国军事支持的计划,让国防支出占国内生产毛额(GDP)较高比例的国家获得更多支持。 根据这项报导的计划,被认定支出不足的国家若遭受攻击,可能不会获得美国协防。 这可能会削弱北约内核第5条款(Article 5)的效力,即任何成员国遭受攻击时,视同对全体成员的攻击。

    海外英语服务营3/10截止报名 有志担任国际志工青年快送件

    侨委会英语服务营每年暑假深受海外青年青年喜爱,今年营队将于7月5日至8月1日举行,预计招募17至25岁青年志工,除了侨青外,英服营亦开放部分名额给台湾华语文学习中心(TCML)学员或主流学校任教台裔教师推荐学生,完成服务主办单位,将颁发80小时服务证明。 金山湾区侨教中心主任庄雅淑表示,侨委会英服营自2006年正式开办以来,到2024年止,逾7500位侨青返台教过英语,受惠的台湾学生超过5万人。四周活动期间,学员们有机会发挥母语优势,同时通过教学技巧,让台湾偏乡学生快乐地学习英语,这对学员本身也是一种自我挑战,同时创建与故乡台湾的情感。去年北加州报名非常踊跃,她提醒,有意参与2025年英服营的学员们把握机会,即早完成报名。 「海外青年英语服务营」报名至台湾时间3月10日截止,有意报名者可先申请i侨卡 (网址:https://icard.taiwan-world.net/tw/register ),再至侨务活动报名系统在线报名 https://register.ocac.gov.tw/cht/index.php?/sign/2025summer。

    西门子拟在美投资近3亿美元 选加州德州建新厂

    德国工业巨擘西门子公司(Siemens)今天表示,规划在美国制造业投资2.85亿美元,包括在加州和德州兴建两座新厂。 美联社报导,美国是西门子的最大市场。西门子近期在美国制造业布局的投资和收购软件公司「澳汰尔工程」(Altair Engineering)的计划,合计在美投资超过100亿美元。澳汰尔工程公司总部位于密西根州。 googletag.cmd.push(function() { googletag.display('div-gpt-ad-1694617103692-0'); }); 西门子总裁暨首席执行官博乐仁(Roland Busch)在声明中说:「我们相信美国工业的创新和实力。因此西门子过去20年在美国投资超过900亿美元。今年的投资将使这个数字超过1000亿美元。我们带来更多任务作机会、更多技术,也为美国人工智能(AI)能力带来助力。」 台湾集成电路制造公司刚宣布,除了先前宣布的650亿美元之外,将在美加码投资1000亿美元,用于新建3座晶圆厂和两座封装厂。 西门子表示,规划在德州沃斯堡(Fort Worth)和加州波莫纳(Pomona)设立两座电器产品制造厂,预期最新一笔投资能创造超过900个有技术的制造业工作机会,在这些工厂生产的设备将支持美国商业、工业和营建业。此举也将让西门子为AI数据中心提供动力。

    回应川普延征加墨关税 加拿大暂停对美征收第二轮关税

    美国总统川普6日同意,让墨西哥和加拿大符合美墨加协定(USMCA)的商品和服务豁免25%的新关税,直至4月2日。加拿大随后也跟进回应,推迟对美国商品征收新关税至4月2日。 加拿大财政部长勒布朗(Dominic Leblanc)在社群平台X表示,「美国已同意在4月2日前暂停对加拿大符合《美墨加自由贸易协定》的出口产品征收关税。因此,加拿大不会在4月2日之前对价值1250亿美元的美国商品实施第二轮关税。」并补充说加拿大政府将继续努力推动取消所有关税。 var admarutag = admarutag || {} admarutag.cmd = admarutag.cmd || admarutag.cmd.push(function() { admarutag.pageview('1aa64996-806f-4094-8fce-923b967576ed'); }); 加拿大4日已对价值300亿加币(约209亿美元)的美国进口商品课征25%关税,而第二轮关税指的是,原本要再对价值1250亿加币的其他美国进口商品,征25%关税。 美国原定4日起对加拿大商品实施关税政策。除石油和能源产品适用10%税率外,其余所有商品均需缴纳25%的关税。但川普6日又发夹弯宣布暂缓实施,是川普一个月内第二次延征加、墨关税,凸显出他贸易政策的不确定性。

    Breaking

    疑煮饭酿祸 刚果民主共和国船只起火翻覆143死

    刚果民主共和国官员18日表示,一艘载有燃料的船只起火翻覆,造成至少143人死亡,数十人失踪。 中央社引述法新社报导,来自该地区的国民议会议员代表团团长洛库穆(Josephine-Pacifique Lokumu)表示,西北部刚果河(Congo River)一艘木船15日发生火灾,船上挤满数百名乘客。 var admarutag = admarutag || {}...

    别让川普失去耐心 美官员曝乌90%同意和平方案 就看俄态度

    美国国务卿鲁比欧18日表示,除非有明确迹象显示俄乌能达成和平协议,否则美国可能在未来几天内放弃斡旋。美国一名高层官员透露,乌克兰国防部长已向美方表示,基辅方面「90%」同意美国总统川普提出的和平方案,接下来的关键,将取决于莫斯科是否愿意加入谈判。 纽约邮报报导,该名官员18日表示:「我们希望在下周於伦敦的会谈中,决定是否启动全面停火。接着会与俄方磋商,告诉他们:这就是我们的『最终提案』,看看双方各自的立场,才能决定下一步。」 var admarutag = admarutag || {} admarutag.cmd =...

    剧中优雅全是假 杨谨华认了拍「影后」罹严重胃病

    杨谨华日前受邀上镜电视「谁来演戏」第二季,和刘品言重返「影后」拍摄场景之一的日胜生加贺屋国际温泉饭店,两人在饭店大啖下午茶、体验手做日本和果子,还在神社为刘品言的姻缘求签。 难得上好姐妹主持的节目,杨谨华不仅聊到不想下车,在节目中更是言无不尽,她说自己天生容易紧张,至今拍每一部戏都还是会紧张,像之前拍「影后」期间,她紧张到天天拉肚子还胃痛,下戏后去检查才发现紧张引发的压力型胃溃疡,让觉得杨谨华演技自在又优雅的刘品言不敢置信。 googletag.cmd.push(function() { googletag.display('div-gpt-ad-1694617103692-0'); }); 镜头上总是从容自在展现演技的杨谨华,她表示自己天生就是属于容易紧张型的,就算已经拿下金钟奖戏剧节目女配角奖,至今每拍一部戏都还会紧张。 杨谨华以「影后」为例,她说开拍前她其实就很紧张,一路紧张到拍完,其中开拍第三天,有场戏她不只有超过一页纸的台词,还得边抽烟边演,但因为自己不常抽烟,当时一抽就头晕,再加上自己紧张导致血液循环加快,让她不只头晕加剧,手更是抖到不行。 而且在拍摄的四个月期间,杨谨华几乎天天拉肚子,东西吃不太下还常胃痛,等戏拍完她还特地去医院检查,结果发现是胃溃疡,而且还是压力问题造成的胃溃疡,让觉得杨谨华演出一向很「放松」的刘品言一脸惊讶,杨谨华无奈地说:「我发誓,(但)讲了都没人信」。 刘品言也跟杨谨华提到之前在节目中访问詹怀云的经验,笑说自己花了3、4个小时,才跟他稍微热络一点点,杨谨华接话回应说:「你花了3、4个小时,我花了半个月」。 杨谨华表示詹怀云真的是个非常可爱的I人,一开始两人面对面读本对戏的时候,原本距离窗户还有一段距离的詹怀云,读着读着不自觉地离她愈来愈远,一度快要贴近窗户,让她只好出言提醒要詹怀云小心别掉下去。不过杨谨华也说到詹怀云,私底下跟听到现场喊开拍时完全是两回事,会马上从I人变流氓,大赞他是个很棒的演员。 杨谨华也说到「一把青」的拍摄期长期7个月,她本来以为自己一拍完就可以从角色走出来,结果没想到在讲述剧中角色演出时,她竟然说不出口,因为一讲就会一直哭,连听到剧中音乐也会哭,这样的状态在剧播出后整整维持了一年。后来她也终于渐渐体会到前辈说的演员进出切换一定要自如,因为这是在保护自己。

    美港口将对中船收费 中国船舶工业行业协会:公然践踏国际贸易规则

    美国贸易代表署(USTR)17日公布对中国制船舶301调查结果的行动,中国船舶工业行业协会19日发布声明表示,中国船舶工业有信心有底气面对各种风险挑战,为全球绿色航运转型提供更多中国方案。敦促美方立即停止错误做法,切莫因一己私利而扰乱全球海事工业产业链供应链的稳定。 声明表示,针对美国贸易代表办公室17日发布的对中国海事、物流和造船领域采取限制措施的公告,中国船舶工业行业协会表示极度愤慨和坚决反对。美方基于虚假指控和失实调查,对中国船舶工业进行无理打压,是对国际贸易规则的公然践踏,更是对全球海事工业协同发展的严重破坏。 googletag.cmd.push(function() { googletag.display('div-gpt-ad-1694617103692-0'); }); 声明指出,中国船舶工业坚持开放竞争、互利共赢的发展原则,始终遵循国际公约、技术标准和市场竞争规律,通过持续创新和高效协作赢得全球船东的信赖。美国造船业的衰落是其保护主义恶果,与中国无关。美国对中国造船业进行限制,将不可避免的扰乱全球海事工业体系,不但对恢复美国造船业毫无益处,甚至将直接导致国际海运成本飙升,同时也会进一步加剧其国内通胀困境,损害美国民众基本生活权益。 声明续指,面对美国毫无根据的恣意打压,呼吁全体造船业同仁团结起来,与所有真诚的国内外合作伙伴携手同行,为全球海事工业持续健康发展注入稳定力量。声明并呼吁国际海事工业界共同抵制美国这一短视行为,共同维护公平市场环境,并称「我们相信,中国政府必将采取强有力的反制措施,捍卫中国船舶工业的发展利益。」 美国针对中国船舶产业的301调查在17日正式发布限制措施。USTR将分阶段收费,第一阶段为针对中国船舶,第二阶段针对液化天然气(LNG)载运船。第一阶段从4月17日起算的180天后(今年10月14日)开始,所有中国制造与中国拥有的船舶,在停泊美国港口时,都将以每趟航程为标准按货物载重收费;第二阶段将在三年后、2028年4月17日开始,USTR将限制以外国制船舶运输LNG,将在22年内逐步增加限制。