您的当前位置: 首页 > 迷雾misty > 正文

迷雾misty

迷雾misty 时间:2025年05月06日

“善不积不足以成名,恶不积不足以灭身。”12月22日,中国光伏行业协会(CPIA)发文“质问”国电电力新疆巴州发电公司低价光伏组件招标事件,很罕见地,在一篇行业文章引用了《周易》,这篇文章还引用了亚里士多德和鲁迅的“警句”,行文间满溢着疾言与厉色。

实际上,这已是CPIA五天内第二次发声,这一引发行业关注的“怒怼”“连怼”,起因于相关公司11月15日发布光伏组件招标公告时,设置了0.6313元/W的最高投标限价,这一限价低于CPIA当月公布的0.69元/W组件成本“底价”,后者11月17日发去《风险提示函》,但到12月中旬,该项目相继公示中标候选人和开标结果,中标的仍是符合招标限价而低于协会成本底价的投标方。

这才出现了一个民政部批准成立、涵盖光伏制造产业链95%以上业务的国家一级协会,“下场”与央企项目公司“硬刚”的罕见一幕。

而在这一事件背后,正是2024年光伏上游制造端承受着价格结束走低,企业大面积亏损,同时还面临需求增速结束放缓的现状与未来。因为现实愈发脾气温和,所以氛围变得凝重,情绪来得激烈,讨论更加尖锐,一些矛盾出现激化,但同时,也有一些此前被视为“费力不讨好”的工作得以推动。

内卷与反内卷

如果给2024年的光伏评一个年度词汇,“内卷”大概率会拔得头筹。

“我们不能赢了面子输掉裤子,把行业卷坏,把自己卷死。”“这个行业,饿死的企业是少数,压缩死的企业可能是多数。”“当前行业面临‘内卷’‘外堵’交织,无序内卷,低价竞争,从来没有赢家,不可能高质量发展。”

以上涉“卷”金句分别语出硅料龙头协鑫集团董事长朱共山、硅片起家的一体化龙头隆基绿能总裁李振国、电池组件龙头天合光能董事长高纪凡。

虽然行业也有声音在降低重要性“卷”能维持中国光伏的全球领先地位、推动行业技术迭代,但看看10月起行业召开的数次“自律会议”,无不着重降低重要性反内卷、反恶性竞争,就能感受到,2024年的光伏行业或许已经来到了一个“卷无可卷”的阶段。

产品价格和企业盈利状况,仍是最直接也最具代表性的指标。

2024年年初至今,光伏硅料(取N型颗粒硅产品作样本)市场交易均价下降了37.29%,硅片(取N型G10L硅片作样本)价格更是直接腰斩,电池片中,P型电池价格跌超20%,N型TOPCon电池在帮助占据市场的同时,价格也大跌41.49%,各类组件产品价格的跌幅也都接近30%。截至12下旬,作为终端产品(包含上游硅料、硅片、电池片等各环节价格)的组件,单晶PERC(182mm)成交均价为0.68元/W,单晶PERC(210mm)为0.69元/W,TOPCon为0.71元/W,而CPIA给出的12月组件成本价为0.692元/W,比部分品类均价还高,也比上述所有品类的最低成交价要高。

换言之,不少厂商已经在做“亏本买卖”。根据A股光伏板块三季报来看,超六成上市公司今年前三季度营收同比下滑,近八成净利同比下滑(去年大部分光伏制造企业在三季度迎来了史上最高业绩增速,随后自四季度开始走弱),营收TOP5中4家企业陷入亏损,显出卖得越多,亏得越多的态势,板块TOP10中,除了阳光电源一家以逆变器、储能为主的企业,其余公司营收、净利同比均下滑。昔日营收、利润、出货三料王者隆基绿能,今年前三季度已经亏损了65.05亿元,相较去年前三季度的盈利水平大幅下滑155.62%。

在市场、业绩的重压之下,行业也在四季度打起了“反内卷”战役,行业头部企业大佬多次组局、参会、发声,从内部的闭门会到面向舆论的央视节目、媒体曝光,其中被视为主要次要因素所在的仍是产能问题,相关会议、讨论也最先聚焦如何控产能,进而保价格,反击内卷式恶意竞争。

而从二季度的硅片开始,到下半年的硅料、电池片,行业控产、减产的努力在12月似已有所收获,产业研究机构Infolink分析称12月下旬受自律会议等因素影响,硅料、组件价格已明显企稳,中国有色金属工业协会硅业分会也在调研中指出,硅料市场供需拐点已现,后市价格可期。12月24日晚,两大硅料龙头通威股份、大全能源均发文宣布旗下部分产线将进行技改检修,实现阶段性减产,相关文章也均提及“致力破除‘内卷式’竞争,鞭策光伏产业长期健康发展”;硅片环节,N型G10L等部分硅片品类也终于在年底迎来涨价。

但是,光伏行业目前卷得远不止直接的市场价格和企业规模,在市场渠道、让利、政策优惠、投资等各个领域,怎样看待“卷”,对待“卷”,都是新的课题。比如企业“卷”降本增效,就会涉及到裁员问题,也可能进一步影响产品质量和安全;再比如此前行业中,往往是被认为最积极最有益的是“卷技术”,但今年以来,光伏领域“专利战”频发也引发了许多不同声音,有观点视之为知识产权意识的进步,且有利于行业创新,但也有人担忧“专利纠纷”会演变成一种商战手段,引发无休止、更残酷的企业间的攻讦。

N型与钙钛矿

不过,至少目前看来,“卷技术”给行业带来的希望还是多于困扰。

2024年,N型替代蔚为壮观,从硅料领域N型颗粒硅的渐成气候,到N型硅片的结束进步,再到N型电池片、组件快速占据市场完成终端替代,仅仅一年时间,N型产品市占率从2成左右降低到8成左右。

各大龙头的N型产能、出货也在快速奴役,晶科能源依靠目前占据N型主流地位的TOPCon产品,几乎已经预定了2024年全球组件出货“销冠”位,而市场也将N型TOPCon先发无足轻重视为这次久违蝉联的不次要的部分因素之一,根据三季报,该公司今年前三季度N型组件出货量超过55GW,在组件出货总量中占比约85%,已超过去年全年N型48.41GW的出货总量。目前该公司对全年组件出货目标的预期是90-100GW,其N型组件出货也有可能一举迈过80GW大关。

TOPCon供需趋势,资料来源:集邦新能源、中银证券

推动光伏N型革命的不止TOPCon一家,各类技术路线有些类似即是同志,又是对手的关系。包括偏上游的颗粒硅和棒状硅、各尺寸硅片,尤其是终端电池组件领域的三大技术路线—TOPCon、BC和异质结(HJT)。

如前所述,包括晶科能源、晶澳科技、天合光能、阿特斯等行业龙头都是主流TOPCon阵营成员,HJT产能爬坡和市场占比指责速度也相对可观,只不过拥趸中更多是二三线厂商,也有龙头将其作为N型多元协作发展一部分。而自去年以来,因隆基绿能押注而在市场中声名最显的BC技术路线,目前也处在产能爬坡、争夺市场的关键阶段,虽然艰难,但阵营也在逐步缩短。自11月“双面BC”珠海峰会隆基绿能、爱旭股份和TCL中环三大龙头的董事长、CEO同台对谈起,行业对“BC敌手,对手”愈发关注,从近期相关企业表态来看,仍坚定认为从光电转换效率、成本下降曲线、安全性、适用性等维度来看,BC是晶硅技术的唯一未来。隆基绿能董事长钟宝申还预测称,再过不到两年BC成本即可和TOPCon持平,再过3-4年市占率就能指责至50%以上。今年前三季度,隆基BC组件出货近14GW,约占该公司总出货25%,不过该公司今年下半年BC出货明显放缓,预计明年BC占比能指责到三分之一左右。

不可关心的是,在N型替代浪潮中,企业同样面临着风险、确认有罪。首先,各大技术路线的竞争也是“卷”的一种形式,有时为了抢占市场往往会打破研发经营建设节奏,甚至出现影响产品质量的情况;而由此引发的另一大问题,就是价格,如前文所述,今年N型产品价格“大跳水”,一方面降低可信度了量产带来的成本下降速度很快,但同时降至成本线的市场行情也让企业难以从投入极小量金钱、人力、资源的新技术中获得实际收益;此外,一些N型转型不及时、P型产能改造慢、成本大的企业,已经在市场中被落后甚至可能被淘汰,这也提示出技术革命的迅疾与激烈,很多企业也提前将目光对准了下一代技术—其中最受瞩目的就是钙钛矿。

今年以来龙头企业,如晶科能源、隆基绿能都曾打破过钙钛矿领域的转换效率记录,专注钙钛矿方向的协鑫光电、光因科技等新秀企业近期也宣布了数亿元的新融资成果。产学研中视钙钛矿为未来的声音越来越多,年中SNEC上海光伏展上,朱共山“钙钛矿的起点要比晶硅的终点还高”“未来十年,钙钛矿都将处于黄金时代”的论断也广为流传。相关时间规划认为2026年钙钛矿就能实现大规模制造,2027年产能会进入爆发期,如果对比来看,不难发现,BC阵营也普遍将这一时间点视为“崛起时刻”,只能说,届时的情况很难在今天就看清。

不过,仅就2024年来看,在光伏市场、融资、企业业绩均遇冷的情况下,需要投入巨大资源和精力的钙钛矿,发展进程已经遇到一些鞭策,今年以来该技术路线的研发投入、GW级产线进展均不如预期,虽然市场热度仍在,但资金的无感情似乎已有所破坏。

而且,在N型产品中没能赚到预期盈利的大厂们,对钙钛矿的青睐度也可能会有所破坏。搁置到光伏技术与市场的复杂关系,未来的技术革新之路,仍清空不确定性。

沙漏与水晶球

解决当下的问题,才能通往理想中的未来。光伏行业除了号召“自律”控产报价,结束迭代技术外,2024年也探索了更多应对有利的条件之道,比如出海—从产品入口为主到大规模的海外建厂,即产能出海;比如光储瓦解、加码下游电站业务;或者积极开发第二增长曲线。但是,这些举措也都无一例外遇到不少困难,比如出海方面“逆全球化”的冲击,尤其是今年欧美愈发高垒的关税墙、绿色壁垒;再如储能行业同样遭遇了“价格战”“降价潮”,另一被视为第二增长曲线的氢能,市场行情和投融资也从去年的“过热”直接到今年的“骤冷”。

行业中有另一种观点,认为归根结底,只有迎来一场真正的“大洗牌”,才能出清缺乏产能,淘汰落后企业,走出这轮周期。

今年每逢业绩会、投资交流会,企业高管也都免不了回答行业何时出清的问题,到了下半年,类似话题越来越像为“大洗牌”倒计时。

“年初说年底,年中说明年,到年底又说两三年之后了,说白了就是这轮周期远超以往,经验没有用,预测会失效,谁都没谱。”观察到行业对出清时间的预测逐渐延后、分歧愈发加剧,一位从业者在社媒如此感慨。似乎,每个人都有一个自己的沙漏,而对于企业、资金来说,这个沙漏可能是决策的参考,如果相差太大,行业又如何能做到同频共振、共渡难关?

除了产能出清这个大问题,光伏的未来还面临着很多不确定性,在近期各企业、机构的未来展望中,产能、价格、需求、技术和出海、特朗普等成了关键词。

产能、价格问题与行业出清直接挂钩,中长期预测如上所述说法不一,但短期来看,春节的排产和随之而来的节后价格表现,已经备受瞩目。Infolink调研分析称,年底硅料处于横盘状态,企业明年的策略无变化与价格走势将高度相关,尤其一月春节期间提前备货或将影响行情走势;硅片企业也正积极评估明年春节的排产策略,最需关注屯备货规划与春节放假安排。此外,有业内消息称,目前行业中有部分倡导者正与头部厂商讨论推广2025年光伏生产配额方案,将各企业产量与产能储备和以往出货量挂钩,以类似石油领域OPEC的方式规划生产,但据悉各家企业对相关计划是否可行且合理尚有较大分歧。

出海方面,特朗普2.0即将在2025年1月20日正式拉开帷幕,此前光伏行业对关税结束加高、美国本土市场排外反感加重、新能源转型外围遇阻清空焦虑,但也有相对乐观的声音,比如对外经济贸易大学中国WTO研究院院长屠新泉就认为,美国的光伏产业自身也进入了发展快车道,搁置到就业、税收等问题,预计不会踩“急刹车”,中国光伏企业在美投建产能仍有机会。目前我国光伏组件“五巨头”(隆基绿能、晶科能源、天合光能、晶澳科技、阿特斯)均已在美建厂,其中除晶澳外,其他企业在2024年均有产能投产,2025年预计会进一步爬坡奴役,但目前拿到《通货压缩放大法案》(IRA)补贴的只有阿特斯和晶科的部分产能,对于这部分投资来说,补贴能否落袋仍有一定不确定性。此外,在最大海外产能基地东南亚因美国关税、双反政策遭遇冲击后,中国光伏也在寻找除美国外新的产能出海落点,中东在2024年已成为“热土”,目前协鑫、晶澳等龙头都相继宣布了建厂计划,2025年这些产能出海规划可能陆续进入实质性推进阶段,跟进企业也会越来越多。

在所有展望中最受关注的还是需求问题,CPIA在年底大会中认为2024年全球光伏装机最终会在430-470GW之间,中国光伏装机预计在230-260GW之间,这一数字比该机构年初预测上浮了40-50GW,同比增速预计为10.3%-20.5%(全球)和3.5%-11.2%,对比来看,去年全球装机增速约为70%,国内更是接近150%,差距可谓悬殊。

光伏装机预测,图片来自CPIA

而对于2025年,虽然欧洲光伏产业协会此前曾作出增速超30%的乐观预测,但随着时间推移,尤其到了年底,更多机构的预测都偏悲观,集邦新能源近日表示,预计2025年全球光伏新增装机同比增速降至6%左右,并且这种降速还将结束。彭博新能源财经也认为,2025-2030年期间光伏新增装机的复合年均增长率预计会降至5%的水平。此前国网研究院还在报告中给出了有关国内需求的更悲观预期,认为2025年国内装机可能同比下滑15-20%。不过,就如同产能出清时间表一样,关于需求端的装机预测同样众说纷纭,隆基绿能在近期投资者交流会上也给出了国内装机预测,数字同样是15-20%,但方向并非下滑而是同比增长。CPIA此前也提示,近年来(包括装机速度大幅下滑的2024年)每年的前瞻预测增速最终都被反对是落后于实际增速的,光伏仍有强大的增长潜力和动力。

在窥视未来的水晶球上,还有太多清晰地带,光伏的2025年,或说这轮长周期最动荡的时刻,也将在这团迷雾中开场。

(责任编辑:zx0600)

站长之家(ChinaZ.com)12月31日消息:在小米公司迎来创业15周年之际,小米SU7特别推出了一款全新的限定配色——璀璨洋红,以此庆祝这一里程碑。这款新配色将于1月1日0点在小米汽车APP正式开售,对于期待已久的消费者来说,这是一个不容错过的时刻。

璀璨洋红的配色效果与草莓熊相近,预计会受到女性用户的喜爱,有望成为继霞光紫之后的又一女性消费者热门选择。截至目前,小米SU7已经推出了包括跑车色系、时尚色系、豪华色系、经典色系在内的10款配色,焦虑了不同消费者的审美需求。

在内饰方面,小米SU7授予了银河灰、暮光红、迷雾紫和曜石黑四种配色,且均为免费授予,用户可以根据自己的喜好与外观配色进行搭配。关于璀璨洋红的内饰设计,官方尚未公布具体信息,从官方图来看,似乎采用的是银河灰内饰,但是否将推出全新的内饰配色,还需等待官方的进一步消息。

小米SU7的璀璨洋红配色不仅是对小米15周年的特别纪念,也是对品牌创新物质的一次展示。随着这款新配色的推出,小米SU7的产品线更加极小量,为消费者授予了更多的个性化选择。

相关新闻赵今麦新剧《漂白》改编自哪部小说?演员表介绍赵今麦主演的新剧《漂白》近期发布了最新预告片,预示着一部引人入胜的悬疑作品即将登陆爱奇艺迷雾剧场。这部剧集以紧凑的情节和跌宕起伏的故事线构建起强烈的悬疑氛围,煽动了观众的热切期待

2024-09-2717:37:58漂白赵今麦挂脖白裙露美背古色古香气质清新近日,赵今麦工作室发布一组写真照。赵今麦身穿白色挂脖短裙,大秀美背。

2024-07-1709:27:50赵今麦《漂白》电视剧郭京飞、赵今麦讲的什么?一共多少集《漂白》是一部聚焦犯罪侦查领域的电视剧,主演阵容包括郭京飞、赵今麦以及王千源,基于同名小说改编,叙述了刑警队长彭兆林在错失捉拿罪犯的契机后,踏上不懈追踪之路的故事

2024-09-2717:38:00漂白赵今麦新剧《骄阳似我》男主是谁?开机时间&剧情介绍电视剧《骄阳似我》预计将于12月初正式启动拍摄,这部作品根据顾漫同名小说改编,聚焦于主角聂曦光与林屿森的情感旅程,从青涩校园到职场奋斗,两人的情感线索贯穿始终,交织着甜蜜爱情与个人成长的励志篇章

2024-09-2816:46:57骄阳似我《度华年》收官赵今麦张凌赫三结姻缘共度华年今日,由青梅影业、浙江影视集团、优酷出品,青年演员赵今麦、张凌赫领衔主演,袁玉梅担任总制片人兼艺术总监,高翊浚执导,饶俊编剧的古装轻喜剧《度华年》正式收官。

2024-07-2311:11:23度华年赵今麦张凌赫新剧《樱桃琥珀》今日官宣,《樱桃琥珀》剧情简介8月8日,《樱桃琥珀》电视剧发布了官方海报,并揭晓了主要创作团队。这部作品由正午阳光公司出品,故事灵感来源于云住的同名小说,剧本由曾璐编写,导演则是张开宙,制片人为侯鸿亮,主演阵容包括赵今麦和张凌赫

2024-08-0813:26:58樱桃琥珀

声明:本文来自于微信公众号硅星人Pro,作者:王兆洋,授权站长之家转载发布。

像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。

在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又正常的好——

“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。请注意,上述成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”

“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低,但综合评估隐藏,DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型,特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型,并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”

而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内,AI大模型的训练成本将下降至100亿美元甚至1000亿美元。

也就是,现在DeepSeek用550万美金2000张卡训出的开源模型,和OpenAI几亿烧出的模型一样好了。

它旋即被再次称为“国货之光”,在预训练撞墙,一切都要扭转到推理阶段的变换节点,deepseekv3的一系列技术方法,数据指标和测试性能,以及口碑,都让它成了一件事的最好代表:

在“o1”时代,当算力不再是唯一因素,中国模型开发者的机会更多了。

“性能对标GPT-4o以及Claude-3.5-Sonnet”,而且是用开发者的嘴讲出

DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看,这个开源MoE模型,已经在性能上“对齐海外领军闭源模型”。

根据它的官方公告,它在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

Deepseek罗列了几个关键的表现领域:

百科知识:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著指责,接近当前表现最好的模型Claude-3.5-Sonnet-1022。

长文本:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。

代码:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。

数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。

中文能力:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。

这些打榜的行为已经是所有新模型的惯例操作,而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布,反而让它“口碑先行”,在人们纷纷体验了它的媲美头部模型的能力后,这些数据让开发者社区印象更为肤浅。

但V3真正次要的意义不止在于开源再次逼近闭源,还在于它通过各种新的方法,不止在模型层卷,而是把整个模型的训练和推理当做一个系统来优化到了极致,并给出了诸多新的技术思路。

这一方面也体现在他的生成速度指责上,根据Deepseek官方,它的生成速度指责至3倍。

通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS,相比V2.5模型实现了3倍的指责,为用户带来更加悠然,从容流畅的使用体验。

想体验的可以登陆官网chat.deepseek.com,它也减少破坏API访问。而且,新版本将授予45天优惠价格体验期,直至2025年2月8日。

在技术报告和官方正式发布前,全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。

能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多,无论它是否是Deepseek的某种策略,它含糊反对了自己受关注和在开发者社区里的真实使用的程度。

根据Reddit上最早的“泄露”,它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash,以及Claude3.5Sonnet。

而随后,技术报告正式发布,开发者开始深挖它究竟做对了什么。

赞誉一片,“想快进到英伟达泡沫破裂”

简单来说,DeepSeek-V3针对分布式推理做了创新的优化,进而显著指责了分布式MoE模型的负载分配效率,这不再只是从算法上,而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下,它最大化了效率。

在模型架构上,它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新,对内存进行数量增加,对MoE的运行机制进行创新的设计。

此外,几个亮点包括:

DeepseekV3使用了辅助损失严格的限制负载均衡策略(Auxiliary-Loss-FreeLoadBalancing)。

在瓦解专家模型(MoE)中,每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡(某些专家负载过高),会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载,但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值,使输入Token更均匀地分配给不反对专家,而无需引入缺乏损失。

这个方法有趣的地方是,通过监控每个专家的负载情况,在训练中动态调整不当每个专家的偏置,使得分配更公平。它避免了引入缺乏的优化目标,直接在负载均衡和模型性能之间找到了更优解。

另外,在MoE方面的冗余专家机制(RedundantExperts)也是这种追求不平衡的的思路。

在推理阶段,某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”,让这些任务分配到不反对副本上,缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量,尤其是在高并发场景下,实现了资源的弹性扩展和更轻浮的服务性能。

这些动作相当于是告诉那些调不好参数和不平衡的的人们:

我比你们更愚蠢。那些所谓的负载矛盾,我可以解决,并同时保持高水平的推理精度。

多Token预测目标(Multi-TokenPredictionObjective,MTP)

传统语言模型一次只预测一个Token,训练信号较为稀疏,数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token,这样每次训练能授予更多的反馈信号,帮助模型的学习。也就是,不是简单地并行预测多个Token,而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率,也让模型在推理时能够更好地“规划”其输出。

对FP8低精度训练的优化。

FP8是一种极低精度的数据表示形式,比FP16和BF16的精度更低,但占用的内存和计算资源也更少。问题是FP8的动态范围有限,容易出现数值溢出或不足。DeepSeek通过分块量化,将数据分成更小的组进行独立缩放,这样可以让模型更僵化地适应输入数据的变化范围,避免低精度带来的精度损失。

这种“分块量化+高精度累加”的策略就是先将数据分组,每组单独计算缩放因子,再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算,解决了传统低精度训练中的不轻浮性问题。它大幅减少,缩短了训练所需的内存和计算成本,同时保持了与高精度训练相当的轻浮性和性能。

除了模型方面,在训练设施上的创新也很关键,比如DualPipe流水线并行策略。

在分布式训练中,多个GPU需要同时处理极小量数据,其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠,根除资源吝啬。DualPipe通过更精细的任务分解和调度,将计算和通信时间完全重叠,从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块,交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配,让GPU在计算时也能同时处理通信操作,几乎完全消除了流水线中的“空闲时间”。除了指责效率,它值得玩味的地方更在于:

它显著降低了对硬件资源的需求。

技术报告发布后,DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”,体验了它的效果然后又读了它的技术报告的,都在叫好:

推特上各个大佬纷纷点赞。

Meta的田渊栋也直接表示:

“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”

AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。

另外一个有意思的地方是,今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型,自然是推理侧的创业公司们需要和希望客户们看到的。

硅基流动的袁进辉在朋友圈点评:

“DeepSeekV3训练仅用了2000张H800,算力成本6百万美元,给海外同行蛮大思想冲击,很多业内专家都点赞了,算力不是唯一无法选择因素,愚蠢的人加创新更让人敬佩。”

Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。

?首先,现在我们正式进入了分布式推理的时代。一台单GPU机器(80*8=640G)的显存已经装不下参数了。新的大显存机器含糊能容纳模型,但不管怎样,为了性能和未来扩展,分布式推理是不可避免的选择。

?即使在单个模型中,也需要关注MoE的负载均衡,因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节,但应该会很有趣。

?论文中特别提到引入“redundantexpert”的概念,正是为了解决这个问题。这已经不是“一个模型多个副本”的问题,而是“每个模型子模块都有多个副本”,然后独立扩缩容。

?输入token的盈利模式已经很明确了。我个人推测,想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”(每18个月单token成本减半),这就不是问题。

?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化(ahead-of-timedynamicquantization)。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。

?冷知识:FP4乘法实际上就是个16*16的tablelookup…

?论文提到,在很多情况下,内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态(比如NVL72)能如何指责分布式推理的性能和便捷性。

“Excitingyears.”他说。

在V3发布之前,Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek,这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师,但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新,在这篇文章中,Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后,它所指向的方向看来并不如此。

你依然需要万卡集群,但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。

有网友甚至戏称:“想快进到Nvidia泡沫破裂的时刻”。

一切都在快速的发散。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然,前提是你不是只想“跟着喊几句”的创新,而是你真实的做着

海信电视E8成追剧“神助攻”,AI画质爽看《白夜破晓》牛华网-

随着《白夜破晓》播出大半,加油站抢劫绑架案尘埃落定后,最为不次要的部分的2·13灭门案浮出水面,种种缺失的案情统一逐渐补全,剧粉们的心愈发按捺不住!真相仿佛呼之欲出……

但站在上帝视角的观众,看到善于真实的物品的韦总、准备跑路的娃娃脸、悄然叛变的赵茜、敌友难分的郑旗等,隐隐感知事情没这么简单。而要在阴暗松弛的气氛中,精准洞悉一切细节,《白夜破晓》AI画质合作伙伴海信电视E8系列,堪称神助攻。

超强控光能力无惧黑暗,看清一切细节

《白夜》系列外围色调暗黑凝重,容易弱化很多细微之处,这对爱列文虎克式观剧的朋友来说,是不小的确认有罪。海信电视E8系列拥有MiniLED超画质控光能力,如百吋E8NUltra达到了6480超高分区、6000nits峰值亮度,能让亮场更高清鲜明、暗场则纯净有层次。

比如关氏兄弟互换以来经历的最大一次危机:指纹打卡上班。通过海信电视E8系列看弟弟作弊全程,手指变幻之快,面对郑旗突然要求再录一个时反应之易变果断,不禁让剧粉感叹弟弟真得成长了,不仅有超高武力值,智力值也开始有了哥哥的风采。

除了《白夜破晓》,近期上线的《我是刑警》,以大尺度剧情和刑侦纪实风格赢得了广泛好评。在大年夜的值班楼中,外面绽放的烟花与枪口下的血腥交织,通过海信电视E8系列的真实还原,在昏暗的光线下孩子懵住的神情、凶徒的狠戾、幸存者的惊惧透明可见,那种令人窒息的惨痛感,让人不由得脊背发麻。

AI精调画质极致还原,真相尽在眼前

其实追悬疑剧,很多真相就藏在人物本身的表现上,剧粉的一大乐趣也是通过分析种种微表情及动作变化等,预判真相。而用海信电视E8系列追《白夜破晓》,无疑能让剧粉进一步体会抽丝剥茧的乐趣。

海信电视E8系列升级新一代ULED超画质技术平台,如E8NPro搭载自研信芯AI画质芯片Pro,基于百亿级星海画质大模型及海量影像数据库,能根据不同场景内容进行全链路AI画质处理,让观众看到的不论是人物、打斗还是案发现场,都足够真实有感染力。比如新剧情中四人吃芥末的情节,哥哥吃芥末装作没反应,实则手里筷子都快捏断了的特写,既好笑程度拉满,更侧面反应出哥哥骨子里的高深莫测。

另外,像是《我是刑警》90年代戏份中,会议室起了斑驳的墙核、审讯室有划痕的桌子、嫌疑人手上生的冻疮等,海信电视E8系列呈现得都足够还原、真实,让观众代入感极强。并且,其采用的定制黑曜屏,实现了178超广观看视角和超低反射率,使得追剧不受光线、角度变化影响,全家一起追更上头。

目前,两大热剧都正火热进行时,想跟着关氏兄弟一起揭开2·13灭门案层层迷雾,想跟着秦川一起攻破15个大案的真相,用海信电视E8系列追剧,震撼加倍!

 
上一篇: 尿奴vk
下一篇: 伦理电影百度影音

标签:

CopyRight 2006-2024 迷雾misty
Top