January 31, 2024

台积电,2nm还没问世,1nm已经开始建厂了

近期,一则关于台积电的传闻令半导体市场沸腾。该公司有望成为全球首家准备生产1纳米的晶圆厂,将会为整个行业设立新的里程碑。1纳米技术被视为半导体硅基材料的终极追求,台积电似乎又一次走在了前沿,力压英特尔和三星晶圆厂等竞争对手。预计将在台湾省南部嘉义县建设的新设施,将为科技产业带来性能和效率的革命性飞跃。

先来简要了解台积电的1纳米工艺:在IEDM大会上,台积电展示了其至2030年实现1纳米节点的宏伟蓝图,并展现出通过多个3D堆叠芯片组实现“数万亿晶体管”集成的雄心。继2纳米之后,台积电对命名方式进行了调整,将1.4纳米和1纳米工艺分别标为A14和A10,与英特尔晶圆厂风格相似。当然,真正的挑战在于台积电如何克服良率和产量问题,这一直是半导体行业近期面临的重大挑战。

据台媒报道,台积电的1纳米计划将耗资巨大,预估总成本将超过320亿美元。该设施预计将建于南台湾科学园区(STSP),占地约100公顷,分为60比40比例规划,以满足晶圆及集成电路封装的生产需求。台积电也计划在台湾建立多个2纳米晶圆厂。作为行业领头羊,台积电似乎在持续推进其先进制程进程。

未来芯片制造商之间的竞争预计将进一步加剧。尤其是Intel即将举行的“旗舰晶圆厂活动”——IFS Direct Connect,届时可能会带来令人意想不到的消息。毕竟,该公司已实现“四年五节点”的目标,接下来将为我们揭示18A之后的技术规划,很可能包括其尖端10A(1纳米)工艺的展望。

不过也要看到的是,1纳米技术的实现仍然需要五年甚至更长时间,因为按计划前面还有多个制程工艺(包括2nm、1.4nm等)尚未问世。从目前的趋势来看,台积电还是保持了领先优势,并且短期内看不到后面的追赶者。

三星新突破:280层QLC闪存,M.2 SSD容量翻倍至16TB

下个月,备受瞩目的年度国际固态电路大会(ISSCC)即将拉开帷幕。届时,众多半导体行业巨头将齐聚一堂,共同探讨最新的技术革新和未来发展趋势。在这场科技盛会中,三星预计将展示其最新研发的NAND-Flash,这款存储器在数据密度方面创下了新高。

据悉,2月20日下午5点(欧洲时间)的一场重要会议,将由三星的高层亲自主持。会议名为“280层1Tb每单元4比特3D-NAND闪存,拥有28.5Gb/mm²的超高面积密度及3.2GB/s的高速I/O传输率”。

三星这一新一代的QLC-NAND-Flash,每个存储单元包含4比特,其面积密度高达28.5Gigabit每平方毫米,这一成就将超越当前市场领头羊长江存储的19.8 Gbit/mm² 232层QLC-NAND。同样,它也超过SK Hynix预告的超过300层、20.0 Gbit/mm²密度的TLC-NAND,以及英特尔首款每单元5比特、23.3 Gbit/mm²密度的PLC-NAND。

以下是目前各大公司3D-NAND存储器的存储密度情况(绿色代表TLC,橙色代表QLC,红色代表PLC,蓝色代表SLC):

三星的这款QLC-NAND预计将超过280层,属于新一代的V9系列。早前,三星已经预告了2024年将启动V9 QLC NAND的生产。初步预计,新产品在面积密度上将提高超过80%,I/O接口速度也将从之前的2.4 Gbit/s提升至3.2 Gbit/s。这不仅展现了三星在存储领域的激进策略,也反映出其在与美光和长江存储等竞争对手激烈竞争中的迫切需求。

三星曾强调,QLC-NAND将是存储市场的长期趋势。尽管其写入速度目前尚存在不足,但预期未来将有显著提升。而更高的面积密度,意味着更低的生产成本,每个晶圆能够容纳更多的存储单元,生产效率得到极大提高。随着这一技术的推出,我们有望在不久的将来看到高达8TB和16TB的M.2 SSD。

同样值得期待的是,美光也将在ISSCC 2024上展示其最新技术。他们将于同一天举办“基于2YY技术的1Tb密度、每单元3比特的3D-NAND闪存,具备300MB/s的写入吞吐量”会议。业界普遍关注,这是否将是美光的新一代存储器,或是目前232层TLC版本的升级。该版本已经为市场上最快的PCIe-5.0 SSD提供了支持。

January 30, 2024

AMD新款8700G跑分数据泄露

最近,著名硬件爆料大神@momomo_us在X平台透露AMD新款Ryzen 7 8700G处理器的CPU-Z测试结果。根据测试数据显示,这款新型APU在性能上表现出色。在单线程测试中,它与AMD自家的Ryzen 7 7800X3D相差无几,尽管在单线程性能上7800X3D略占优势,但在多线程测试中,8700G则略微领先。然而,这两款AMD芯片的性能仍然略逊于Intel的Core i7-12700KF,后者多出四个线程,但因为这些线程运行于E核,速度较慢。

Ryzen 7 8700G的测试配置包括ASRock B650 Pro RS主板,搭配32 GB DDR5-6400内存,时序为32-39-39-102。测试时使用了APU内置的Radeon 780M图形处理器,并在一块500 GB Seagate BarraCuda 510 SSD上安装了Windows 11操作系统。在单线程测试中,Ryzen 7 8700G得分为675,略低于Ryzen 7 7800X3D的683分;而在多线程测试中,它以7318分对7301分略占上风。对于一个65W TDP的APU来说,与120W TDP的CPU相比,这样的表现相当不俗。与此相比,Intel Core i7-12700KF在多线程测试中的平均得分为7754分。虽然CPU-Z测试并非全面,但至少为我们展现了AMD新一代Zen 4 APU在性能上的初步潜力,看来它与AMD最优秀的Zen 4 CPU相媲美。

AMD Ryzen 7 8700G是一款2024年1月推出的桌面级处理器,拥有8核心,建议零售价329美元。它是Ryzen 7系列的一部分,使用Zen 4(凤凰)架构,并适用于Socket AM5插槽。得益于AMD的同步多线程(SMT)技术,核心数有效翻倍,达到16线程。Ryzen 7 8700G配备了16MB L3缓存,标准频率为4.2 GHz,但在特定工作负载下可以提升至5.1 GHz。AMD在4纳米工艺节点上制造此芯片,采用了250亿晶体管,由台积电代工生产。Ryzen 7 8700G还支持解锁倍频器,极大简化了超频操作,使用户能够轻松设置任意超频频率。

就热设计功耗(TDP)而言,Ryzen 7 8700G为65W,符合现代PC的标准功耗水平。它支持双通道接口的DDR5内存,官方支持的最高内存速度为5200 MT/s,但通过超频(以及适当的内存模块)可以实现更高速度。此外,它还支持ECC内存,这对于防止关键系统中的数据损坏至关重要。Ryzen 7 8700G支持PCI-Express Gen 4,并配备了Radeon 780M集成图形解决方案。配备了Wraith Spire散热器。

本站的对比数据

Ryzen 7 8700G支持硬件虚拟化,显著提升虚拟机性能。支持运行使用高级矢量扩展(AVX)的程序,这一点对计算密集型应用的性能提升有显著帮助。除了AVX外,AMD还新增了对更先进的AVX2和AVX-512指令的支持。

英伟达的GPU升级计划

最近,Nvidia发布了2025年AI GPU的产品路线图。新的GPU旨在延续Nvidia在AI领域的主导地位,在ChatGPT震撼世界之后,AI市场开始起飞。

路线图中最令人惊讶的是Nvidia计划每年都发布GPU。Nvidia H100于2023年发布,比其前身A100晚了两年。分析人士表示,Nvidia没有对手能真正挑战它,而且每年升级GPU的速度也给竞争对手带来了压力。

Intel已经处于落后位置,计划于2025年推出的Falcon Shores GPU, AMD的MI300于2023年底推出。即使是Nvidia的客户(如OpenAI)也在考虑开发自己的AI芯片,因为运行AI的成本非常高昂。

Tirias Research首席分析师Kevin Krewell表示:“Nvidia可能正在加快其路线图,因为它希望拉开自己与竞争对手、甚至是客户之间的距离,许多客户现在都在设计自己的AI芯片。”

Nvidia H100已经获得了溢价,下一代GPU的价格可能会更高。部署AI工作负载的客户,比如游戏玩家,将会花钱购买最新、最好的硬件。

芯片发展也处于拐点,这使得Nvidia每年都有可能升级GPU。从架构角度来看,Nvidia在集成处理、IO、内存、通信及封装方面,还有许多变量和选项可以发挥作用。Krewell表示:“半导体市场也正在进入一个chiplet的新时代,这可能会改变Nvidia设计芯片的方式。”

年度升级还包括CPU和网络产品。这种升级节奏可能不适用于AI芯片竞争对手,这些公司仍在努力寻找芯片客户。

新路线图

Nvidia的新路线图列出了与计算和通信相关的年度产品。它将基于x86芯片的GPU和基于定制ARM处理器设计的GPU、CPU区分开来。

对于和x86相关的GPU,Nvidia H100 GPU的继任者将是H200,将于2024年发布。同年,Nvidia还将发布B100 GPU,最终在2025年发布X100 GPU。

该路线图还列出了基于Ada Lovelace架构的l40的继承阵容。l40是H100的精简版,但在AI训练和推理方面比上一代A100 GPU要快。Nvidia正在引导急需H100 GPU的客户购买L40S GPU。

L40S的继任者将是2024年的B40和2025年的X40。路线图显示了用于“X86企业和推理”的L40S-B40-X40阵容,这意味着它针对推理进行了优化。

Nvidia CPU路线图提供了其ARM处理器的年度升级,可以与上面提到的GPU配对。

据推测,目前拥有HBM3E内存的GH200将于2024年上市,并与H200 GPU绑定。GB200也将于2024年推出,设计用于B100 GPU。GX200将于2025年推出,专为X100 GPU设计。

Nvidia将为AI训练增加NVLink互连,提供ARM CPU和相关GPU之间的高速连接。GH200NVL (H200 GPU)和GB200NVL (B100 GPU)将于2024年上市,GX200NVL (X100 GPU)将于2025年上市。

Databricks负责生成式AI的副总裁Naveen Rao表示,CPU与大模型的关系要小得多,但Nvidia的ARM CPU和GPU包是AI训练的绝佳组合。Rao之前是AI初创公司MosaicML的CEO,这家公司2023年初以13亿美元的价格被Databricks收购。

Rao补充说,IntelCPU中的AMX等技术也可能非常相关,但它们需要更大并能够大规模实现多芯片扩展。

新的路线图还将其用于Infiniband接口的Quantum产品的网络带宽从2024年的400G增加到2026年的1600G,主要用于以太网和超大规模基础设施的Spectrum-X。Nvidia的DGX系统同时使用Infiniband和以太网网络技术。

Chiplet如何定义路线图

从历史上看,Intel每年都会升级芯片,要么采用新的制造技术,要么采用相同制造工艺的新功能。但随着缩小制造节点变得具有挑战性,这一速度放缓了。

Real World technologies首席分析师David Kantor表示,芯片设计目前正处于一个拐点,FINFET等传统技术正在失去动力。传统的芯片设计侧重于将所有组件集成到单个芯片中,一个新兴趋势是将SoC和芯片分解成Chiplet,或更小的计算、I/O和通信单元,它们可以组装在2.5D或3D封装中。

Nvidia拒绝就其下一代GPU发表评论。但业内专家表示,Nvidia在GPU、DRAM、I/O和SRAM集成方面有很多选择可以探索,并提出了许多芯片外观的可能性。到2025年,Nvidia还可能选择Intel作为X100的制造合作伙伴。

此次升级的H200芯片包括新型HBM3E内存。Nvidia去年发布了GH200芯片,并在路线图中将其与H200 GPU连接起来。

在H200之后,Nvidia可能会开始使用chiplet,将GPU模块化成块,在一个封装中可以选择CPU、加速器和互连。各个模块可以使用不同工艺制造。

例如,B100和B40芯片的计算块和内存可以在台积电的N3工艺上制造,而SRAM块可以在较老工艺上制造。N3不能很好地扩展到GPU的SRAM和模拟部分,因此集成这些在老的制造工艺上制造的模块将是一个优势。

到2025年,Intel的18A工艺将上线,并可能超过台积电,而Nvidia可能会和Intel的晶圆厂合作来生产X100。Nvidia已经在Intel的下一代处理器上制造了测试芯片,CEO黄仁勋对结果感到满意。预计到2025年,台积电将从N3转向两纳米的N2。Intel和台积电都将在这些节点上采用gate-all-around技术。

AMD RX 7600 XT正式发布:16GB大显存、中国不卖

NVIDIA RTX 40 SUPER系列显卡轮番登场,AMD也终于有了新卡,但完全不在一个层级上,这就是RX 7600 XT,主打的是1080p高画质或者2K中等画质。

RX 7600已经发布了八个月之后,而这款RX 7600 XT原本预计会使用更高级的中等核心Navi 32,从而大大提升规格,但没想到还是小核心Navi 32。

它还是32个计算单元(2048个流处理器)、32个光追单元、64个AI单元、32MB无限缓存、128-bit显存位宽。

变化在于,核心频率从2250-2660MHz提高到2470-2760MHz,显存容量从8GB翻番到16GB(频率仍然是18GHz),整卡功耗从165W增加到190W。

比较特别的一点是,官方规范里它不再支持DP 1.4a,而仅支持DP 2.1。

RX 7600 XT官方定价329美元,相比RX 7600贵了足足60美元,但因为暂时不在国内上市(主力卖性能类似当更有性价比RX 6750 GRE),所以没有国行售价。

至于性能,官方对比的居然是RTX 2060,号称领先最多90%。

TPU测试了一款蓝宝石的RX 7600 XT Pulse,发现它比RX 7600只提升了10%左右,同时领先RTX 4060大约7%的样子,还远不如RTX 3060 Ti。

功耗确实涨了不少,待机4W、游戏198W、最高200W,相比之下RX 7600分别只需2W、154W、155W。

January 29, 2024

微软定义AI PC准入门槛!Intel酷睿Ultra全军覆没

Intel酷睿Ultra出师未捷身先死!

从去后半年Intel和PC厂商就开始炒作AI PC,Intel更是早早宣布将推出集成NPU的酷睿Ultra系列处理器。AI PC的洗脑模式自此开启。

在CES2024展会上,联想、惠普、戴尔、华硕、宏碁、微星等一众OEM厂商都展示了自家基于Intel酷睿Ultra系列处理器的AI PC产品。联想更是一下搞出了十来款,AI PC自然成为了今年CES2024的焦点。

PC得有多少年没有被这么关注过了!

AI PC被看做是PC市场再度繁荣的契机,类似于给汽车装上智能座舱系统,PC厂商自然不遗余力地推广自家AI PC的产品。作为上游厂商的Intel、AMD、Nvidia也没有闲着。炒的最欢的是Intel,Intel 酷睿Ultra处理器被一众厂商热捧,热度一时无两。

不过,转折来了。

据外媒Tom's Hardware消息,微软正在为AI PC的配置设定一系列新的“最低准入门槛”。

据市场调研机构TrendForce给出的详细数据显示:AI PC所需的最低内存配置为16GB,至少需要40TOPS的算力。

其中最低16GB内存这个条件很好满足,这两年推出的新款笔记本电脑的内存基本上都是16GB起步,甚至有一段时间是32GB内存起步。

最难的是40TOPS的算力。

要知道,英特尔去年 12 月推出的 Meteor Lake 的 CPU、GPU、NPU 综合算力最多为 34TOPS,目前还达不到微软的标准。出师未捷身先死,有木有!!!

不过Intel将在今年推出Lunar Lake处理器,其算力有望突破40TOPS,最早也得后半年了!

微软的这个标准是基于流畅、灵敏地运行微软Copilot智能助理所需要的算力给出的硬件标准。对于不使用Copilot智能助理的用户来说,40TOPS的算力需求就不成立。不过从微软力推Copilot的态度来看,很可能会强制装载。

目前发布的AI PC都是采用OEM自家的AI模型,因此算力需求可能存在差异,不过从OEM厂商的宣传来看,34TOPS的算力已经可以满足了他们的大模型需求了。

微软作为系统的供应商,本身集成的AI模型的应用肯定要比OEM厂商更为广泛。尤其是对于那些研发实力不足以自研AI模型的厂商,直接用微软的Copilot是最佳选择,但Ultra处理器本身算力还不足,可能会影响到实际的体验。

对于用户来说,选购AI PC首选拥有自己AI模型的品牌,对于算力需求没有那么高,本土化做的也更出色一些。如果没有看上的产品,建议等等Intel下一代的处理器,保证微软Copilot智能助理能够流畅地跑起来,不会影响你的日常体验。

回到话题本身,AI PC时代,谁来定义AI PC的最低硬件标准呢?

在我看来,芯片和OEM厂商的权重更高一些。微软虽然是系统供应商,但对于OEM厂商、用户而言它的Copilot智能助理并不是必须的,而且替代品有很多。OEM厂商可以根据需求调整PC算力,再根据算力优化AI模型,虽然可能会造成一定的性能和功能上的缺失,但胜在完美适配,体验流畅。

AMD下代RDNA4显卡,7900XTX性能,只卖一半价格

最近,市场上关于AMD的下一代显卡系列的消息备受关注。据悉,AMD可能会阶段性放弃骨灰游戏发烧友市场,这表明,我们可能见不到RX 7900系列的后续产品与NVIDIA的GeForce RTX "Blackwell"系列的高端产品进行竞争。取而代之的是,AMD将推出类似于RX 5000系列RDNA的产品线,其中旗舰产品预计在400美元左右的价格区间提供极具竞争力的性价比。

根据Moore's Law is Dead(摩尔定律已死)的最新研究报告,基于下一代RDNA4架构的顶级Radeon RX 将提供与当前RX 7900 XTX(999美元)相当的性能,但其售价将不到后者的一半(约400美元)。这一性能的实现预计将依赖于更小、更简单的芯片设计,从而大幅降低板卡成本。同时,AMD可能会采用台积电的4纳米级别制程工艺,进一步提高能效,有望以更少的计算单元达到与RX 7900 XTX相当的性能。

值得注意的是,AMD曾有传闻称其正在设计一款基于chiplet小芯片整合封装的旗舰GPU Navi 4C,涉及多达15-20颗小芯片的整合,并为此申请了专利。但由于性能和能效表现不佳,该计划最终被搁置。

回顾历史,我们发现在第一代RDNA时代,AMD凭借主流产品RX 5700 XT击败了RTX 2070,迫使NVIDIA推出RTX 2070 SUPER升级版。然而,当时的市场环境与今日大不相同。光线追踪、超分辨率、帧生成、AI等技术尚处于起步阶段,AMD能够凭借在传统光栅化游戏中的优异表现占据一定优势。但在今天,随着NVIDIA在新技术方面的快速发展,AMD面临更大的挑战。所以,AMD准备采取的这一策略转变被视为对显卡市场格局的一大挑战,其性能媲美7900 XTX、价格不到一半的策略可能会对整个市场产生重大影响。(毕竟便宜才是硬道理)

日本官方终于决定淘汰软盘

日本经济产业省最近宣布,已颁布并实施《关于部分修订经济产业省相关部令以推进监管改革以塑造数字社会的部令》,废除了必须使用软盘、光盘等特定存储介质的规定。

是的,1971年就已诞生、只有1.44MB容量的软盘这种在很多人看来已经被扫进历史故纸堆的电子古董,在日本依然大行其道,类似的还有传真机、翻盖手机、VGA接口、笔记本网线……

其实早在2022年,日本数字大臣河野太郎就公开怒斥,日本政府有1900多项业务依然依赖软盘、光驱等老设备来提交表格和申请,亟需淘汰,改用在线云服务。

这一番言论,当时就引发了广泛的关注,但在日本波澜不惊,软盘仍旧大行其道。

这一次,日本终于从官方政府和法律法规层面决定淘汰软盘,并修改了多达34项部令(名单附后)。

但是,日本这次能否真的开启软盘淘汰进程,仍旧值得怀疑,毕竟,整个社会实在是太固执了。

一方面,日本老龄化严重程度在全球都“遥遥领先”,老年人对于新技术非常排斥,更愿意使用自己熟悉的老技术;

另一方面,日本政府和企业官僚化严重,推动整体变革难度重重。

软盘,这个诞生于 “ 世界还没有连上网络 ” 的产物,是个人计算机上最早的可移介质。

但是现在,人们更多只能在保存键的图标上见到它了。

就是这么个早在 2000 年,就快销声匿迹的玩意,却还在统治着日本政府的办公。

一下就激起大家的疯狂吐槽。

不光光是软盘,传真机和印章都被强制要求保留。

一些科技公司还鼓励大家把数据刻录到光盘里,然后再附上一张手工填写的数据。

疫情最严重的时候,科技公司 Venture Republic 的员工们也必须回到办公桌前。就为了给文件盖一个红章。

所以,日本数字部长才忍不住要开炮,嘲讽日本人还在坚持不懈使用传真机,而不肯用电子邮件 ▼

但地方政府压根不怎么搭理他,他们坚信这种软盘方式,更安全,也更有保障。

软盘和磁带这些老古董们,就理所应当地在橱窗里售卖。

AMD下一代显卡RX 8000

早有传闻称,AMD下代显卡将放弃旗舰市场,但同时也有好消息,那就是更有性价比,更甜点,一如当年的HD 3800系列。

根据MLID的最新曝料,AMD RDNA4架构的RX 8000系列显卡的顶级型号,将带来现有旗舰RX 7900 XTX档次的性能,但价格还不到一半,预计大约只要400美元左右——RX 7900 XTX的首发价为999美元。

新卡将放弃庞大的巨型核心,面积更小,结构更简单,能效更高,因此成本更低,价格更便宜。

制造工艺方面,AMD大概率会升级到台积电4nm级别,也有助于提高能效,甚至可能只需更少的核心数量,就能获得更好的性能。

根据此前传闻,AMD曾经设计了一个chiplet小芯片整合封装的旗舰GPU Navi 4C,包含多达15-20颗不同小芯片,甚至为此申请了专利,但因为实际性能、能效不佳,最终被取消。

第一代RDNA时代,AMD曾经利用主流化的RX 5700 XT击败了RTX 2070,打乱了对方的部署,不得不推出RTX 2070 SUPER升级版。

不过在当年,光线追踪、超分辨率、帧生成、AI等技术还很初级甚至没有,AMD可以凭借在传统光栅游戏中的突出表现占据一定的优势。

如今,NVIDIA在新技术方面一路狂奔,AMD完全无力追赶,单凭更高的性价比恐怕难以赢得足够多玩家的心了。

工业和信息化部、教育部、科技部、交通运输部、文化和旅游部、国务院国资委、中国科学院等七个部门联合,印发了《关于推动未来产业创新发展的实施意见》。

其中在重点任务环节提出要做强未来高端装备,面向国家重大战略需求和人民美好生活需要,加快实施重大技术装备攻关工程,突破一系列高端装备产品,以整机带动新技术产业化落地,打造全球领先的高端装备体系。

其中就有超大规模新型智算中心,加快突破GPU芯片、集群低时延互连网络、异构资源管理等技术,建设超大规模智算中心,满足大模型迭代训练和应用推理需求。

还有6G网络设备,开展先进无线通信、新型网络架构、跨域融合、空天地一体、网络与数据安全等技术研究,研制无线关键技术概念样机,形成以全息通信、数字孪生等为代表的特色应用。

以及量子计算机,加强可容错通用量子计算技术研发,提升物理硬件指标和算法纠错性能,推动量子软件、量子云平台协同布置,发挥量子计算的优越性,探索向垂直行业应用渗透。

January 28, 2024

AMD下一代移动APU规格泄露

近期,知名硬件爆料人Everest(@Olrak29_)在推上爆出AMD即将推出的移动处理器系列——“Kraken Point”的独家内部构造。这些处理器被业内预测为2025年推出,是继Ryzen 8040 “Hawk Point”系列之后的新一代主流笔记本APU。

Everest最初在X上披露的信息仅提到Kraken Point处理器将整合Zen 5和Zen 5c两种核心。但他随后补充说明,这些处理器将总共拥有八个核心,其中包括四个大核心和四个小核心。根据媒体的过往报道,这些处理器可能采用8核心、16线程的配置。然而,2023年底泄露的内部PPT并未提及将效率更高的Zen 5c “Prometheus”核心与预期的Zen 5 “Nirvana”核心结合使用。

Everest还透露,"Kraken Point"在多个方面与“Hawk Point”系列有着相似之处。最终的零售产品可能会包含四个工作组处理器(WGP),从而提供共计八个计算单元(8 CU)。关于AMD所选用的集成显卡技术,他给出的答案简洁且明确——RDNA 3.5。此外,先前的泄露信息称XDNA 2将用于驱动神经处理单元(NPU),预计其性能将达到45至50 TOPS。据悉,Kraken Point APU将继续使用被认为更稳妥的单片式芯片设计,并有可能将在4纳米工艺上(细节尚不明确)制造。同时有传言称,AMD已经在台积电(TSMC)预订了一系列下一代的硅材料。

马斯克暗示特斯拉将采购AMD用于人工智能

特斯拉CEO埃隆·马斯克近期宣布,为强化公司在人工智能训练领域的实力,计划斥资数十亿美元购置人工智能处理器。在马斯克的采购清单上,Nvidia的AI GPU名列前茅,紧随其后的是特斯拉自研的Dojo处理器和AMD的硬件产品。值得一提的是,AMD已为特斯拉的信息娱乐系统供应了系统级芯片。

马斯克在X平台的一次发言中提到:“尽管一台Dojo超级计算机需要5亿美元,当然不算小数目,但也就相当于Nvidia的10万块H100。”特斯拉计划用这些资金建立一个装载Dojo的数据中心,这些Dojo将主要用于计算机视觉、视频识别处理和机器学习。事实上,特斯拉在Nvidia的硬件上的投资远超5亿美元,这主要包括了H100和H200 GPU,以及预计在今年晚些时候推出的基于Blackwell技术的B100。

据Omdia数据显示,特斯拉去年采购了15,000台H100 GPU,由此可见,公司正加速扩大其Nvidia硬件的使用。马斯克在社交媒体上表示:“特斯拉今年在Nvidia硬件上的投资将超过这一数字。如今,要在AI领域保持竞争力,每年至少需要投入数十亿美元。”

此外,当被询问特斯拉是否也在购买AMD的AI硬件时,马斯克肯定且简洁地回答了“是”。AMD目前在AI硬件领域有着多样的产品线,包括Instinct MI200、MI250、MI300X加速器,以及整合了Zen 4 x86通用核心和基于CDNA 3的计算集群的Instinct MI300A加速处理单元。

AMD公布的性能数据显示,其Instinct MI300X在AI和高性能计算领域的表现超越了Nvidia的H100 80GB。尽管如此,H100 80GB目前被谷歌、Meta(原Facebook)和微软等大型云计算公司广泛使用。由于这些公司在H100上运行的工作负载将能平顺地扩展到新加入的H100,AMD的MI300X并非直接针对H100的竞争,至少在现有客户和工作负载方面是如此。然而,AMD展示的性能数据似乎预示着,Instinct MI300X将可能成为Nvidia即将推出的H200 141GB GPU的强劲竞争者。

January 27, 2024

AMD性价比新王诞生,这块新U跑分结果出来了

近期,AMD即将推出的Ryzen 7 5700X3D处理器在Geekbench 6的基准测试中展现了引人注目的性能。这款处理器在测试中的得分与其高端前辈Ryzen 7 5800X3D相媲美,这一成绩令人惊喜。5700X3D与5800X3D的接近表现凸显了它在性价比方面的优势。如果5700X3D在Geekbench中的表现能够顺利转化为实际游戏性能,那么它将成为对性能和价格都有较高要求的游戏玩家和发烧友在AM4平台上的一个非常吸引人的X3D芯片选择。鉴于其出色的表现,5700X3D很有可能很快成为媒体评选出的最佳游戏CPU之一。这款芯片计划于1月31日上市,预计售价为250美元。

在Geekbench 6的单核测试中,Ryzen 7 5700X3D得分为1926分,而在多核测试中得分为10514分。与同一测试中的Ryzen 7 5800X3D相比,5700X3D在单核测试中慢了11%,在多核测试中慢了8%。

鉴于5700X3D与5800X3D规格之间的微小差距,5700X3D在Geekbench 6中的表现实属合理。两者在硬件配置上几乎相同,均搭载八核Zen 3 CPU和96MB L3缓存,得益于AMD的3D-VCache技术。两者唯一显著的区别在于频率,5700X3D的基础频率为3GHz,加速频率为4.1GHz,而5800X3D的基础频率为3.4GHz,加速频率为4.5GHz。

这款CPU在游戏上的表现足以与AMD和Intel的最新产品相媲美。AMD现有的Ryzen 7 5800X3D至今仍是一款极具竞争力的游戏芯片,其最佳性能可媲美AMD的Ryzen 7000 3D-VCache CPU,即便是最差表现,也能与AMD和Intel的现代低端硬件如Ryzen 7 7700X或Core i7-12700K相抗衡。

对于定价250美元的5700X3D来说,它可能是一款性价比极高的芯片,以比5800X3D低70美元的价格提供接近90%的性能(依照当前的价格)。然而,对于Geekbench 6的测试结果,我们建议持谨慎态度,因为Geekbench并不能完全展现这款芯片的全部性能。在对这款新CPU做出最终判断之前,还需要等待Ryzen 7 5700X3D的完整评测。

January 26, 2024

ASML 7nm及以上先进光刻机一律无缘中国

荷兰光刻机巨头ASML(阿斯麦)发布了2023年第四季度及全年财报,业绩好得令人羡慕。

2023年第四季度,ASML净销售额72亿欧元(¥561.0亿),高于预期,毛利率51.4%,净利润达20亿欧元(¥155.8亿)。

经历了几个“平淡”的季度后,四季度新增订单金额多达92亿欧元(¥716.8亿),其中56亿欧元(¥436.3亿)来自EUV光刻机。

2023全年,ASML净销售额达到276亿欧元(¥2150.6亿),毛利率为51.3%,净利润为78亿欧元(¥607.7亿)。

其中,尚未交付的订单总额为390亿欧元(¥3038.6亿)。

ASML 2023年第四季度售出全新光刻机105台、二手光刻机7台,全年售出全新光刻机421台,年增104台,售出二手光刻机28台,与上年持平。

不过,ASML并未披露EUV光刻机的具体销售数字。

ASML预计,2024年净销售额将与2023年基本持平,毛利率略微降低。

毛利率降低的原因一是EUV光刻机业务继续增长,但浸润式光刻机业务会有下降,二是将投资扩大产能。

其中,2024年第一季度净销售额预计约为50-55亿欧元(¥389.6-428.5亿),毛利率约为48-49%。

2025年毛利率预计将提高到54-56%,主要得益于EUV光刻机业务的更快增长,以及2024年产能投资的回报。

发布财报后,ASML首席财务官Roger Dassen接受了视频采访,其中提到了大家非常关注的光刻机对中国出口问题。

Roger Dassen确认,荷兰和美国最新颁布的出口管制法规已经生效,ASML对出口管制的适用范围和影响,与政府做了进一步沟通。

ASML预计,出口管制将会影响ASML 2024年中国市场10-15%的销售额,然而仍可看到终端市场对于成熟制程的需求依旧旺盛。

这部分市场的需求很稳定,去年很稳定,未来也将继续保持稳定。

可以预计的是,2024年,ASML将不会获得向中国发运NXT:2000i及以上浸润式光刻机设备的出口许可证。

同时,个别中国先进芯片制造晶圆厂将无法获得发运NXT:1970i、NXT:1980i浸润式光刻机设备的出口许可证。

另据外媒报道,中国大陆于2023年12月从荷兰进口的光刻设备金额高达11亿美元,同比增长近1000%,环比增长也高达44.2%。

根据之前的数据显示,中国大陆于2023年11月进口了42台光刻设备,总价值高达8.168亿美元。其中,有16台光刻机是来自荷兰的ASML,总价值7.627亿美元,同比增长了1050%。

2023年10月中国大陆从荷兰进口的光刻机数量更是高达21台,总价值为6.725亿美元,相比比11月进口的16台光刻机的总价值还要低。

显然,如果从均价来看,11月中国从荷兰进口的光刻机均价要比10月进口的光刻机高出46%。

整体来看,在2023年四季度,中国大陆从荷兰ASML进口的光刻机总额达到了25.352亿美元。

根据业界的分析,近几个月来,中国大陆从荷兰ASML进口的光刻机数量和进口额的激增,可能是ASML赶在其许可证在2023年12月31日失效前匆忙出货的结果。

顺带说说台积电。

根据分析师Dan Nystedt披露的数据,2023年第四季度,300mm晶圆的平均价格高达6611美元,约合人民币4.8万元,创下历史新高,相比一年前飙升了22%!

当季,台积电出货的晶圆折合300mm总计295.7万块,最近三年第一次不足300万块,相比2022年第四季度的370.2万块少了足足20%。

但因为价格上去了,台积电的收入却没怎么少。

当然,工艺越先进,晶圆就越贵,N3 3nm级别工艺的每块最贵可达2万美元(约合人民币14.3万元),确实比N4/N5、N6/N7节点上贵得多。

工艺节点分布方面,N3只是第二个季度取得收入,就奉献了29.43亿美元,占比已达15%。

N5依然是绝对主力,收入68.67亿美元,占比高达39%。

N7收入也有33.354亿美元,占比为17%。

以上三种先进工艺合计占了台积电总收入的67%,如果在算上16nm,所有的FinFET工艺收入占比为75%。

成熟工艺方面,28nm 7%,40/45nm 4%,65nm 5%,150/180nm 4%,110/130nm 3%。

VxWorks

Blog Archive