EDA/IC设计
前言
临近博士毕业,重复我读博前调研过程,经过思考后最终决定还是坚持走EDA。调研期间,我通过各种方式(工作面试、与老师/前辈/朋友约谈、实地沟通等)走访了约20家国内数字方向的超大规模集成电路的企业、以及它们的不同部门、不同层级的同事,这些企业包括主要的芯片设计厂商、EDA公司以及初创(偏硬件加速器)企业,部门从最前端到最后端涉及异构加速算法(算子)研发、编译器研发、架构设计、验证生态、EDA(布局布线、原型设计、版图优化、仿真、计算光刻、良率优化)等。这些企业和同事在交流时都很重视与很真诚坦率,阐述了很多我不了解的现实问题和教会了我很多不曾深刻理解的概念、分析思路、与操作。为此我非常感激。聊下来不容易,我想未必每个人都有我的时间经历和莫名执念要这么捣鼓。因此我想这样一轮交流,放在我的脑子里,不如分享出来,或许对后面将来投入这个行业的学弟学妹或者关心这个行业的人们或许有用。作为一个临近毕业的学生,我很关心中国集成电路路在何方,所以提供一些主观的信息和想法。未必正确准确,欢迎纠正和批评。或许用处不大了,但也算有一分光与热,因为我始终相信只有核心科技掌握了、有强力而普遍的高附加值产业,才能提高中国老百姓们的生活水平。希望二三十年以后的国人回首,不会看着我们现在的选择哭笑不得吧。
为了保护国内产业、对应企业和部门的利益,后面都不会提及/对比任何具体国内公司的名字、技术内容、发展方向、数字指标,只用碎碎念的形式来讨论一些我所看到现象和想法。
1.行业定位分布:怎样才算卡脖子
“卡脖子”是集成电路产业里面的常见关键词,几乎每一个相关企业都会提及。就如前言中异构加速算法研发、编译器研发、架构设计、验证生态、EDA(布局布线、原型设计、版图优化、仿真、计算光刻、良率优化)等环节,是涉及芯片各个环节的问题,从前往后可以归类为:怎么用芯片、怎么设计芯片、怎么生产芯片。涉及这三个方面的企业数量和体量是依次递。这是可以理解的,因为用芯片用到极致的人,会关心设计芯片的好坏,而设计芯片到极致的人就需要关心生产是否可行。尤其是主营业务核心优势在于其硬件电路的企业(如通信、数据中心、安防等),就会很关心芯片设计与生产。
1.1 芯片的生态
用芯片难点在于生态,一块芯片扔给一个普通人是用不起来的,芯片需要在软件的控制下,通过与外部其他电路和系统整合,才能发挥他们的极致性能。这不是一个企业在自己努力下能短期解决的,这需要联合上下游厂商和用户来推动的:
(1) 在硬件生态中,例如一个CPU芯片,用在什么场景、和哪些其他芯片协同组合、怎么连接他们构成系统,能够让他们稳定工作且尽可能高效。
(2) 在软件生态中,例如一个CPU芯片,我们通常要生成二进制文件(软件)才能让CPU执行,而为了获得二进制文件,工程师们需要写程序代码如C/C++/Java/Python/CUDA/Go等等各种语言然后利用编译器“翻译成”二进制文件,工程师们在成长与学习过程中已经养成了“习惯”,更改是很困难的,就像我们很难说汉字博大精深就让外国人用一样。描述方便、翻译成底层指令效率高则是软件生态难的地方。
只要这些做的不好,纸面数据多么优秀,都很难获得大量订单。就像单反相机如此优秀的摄影性能,但是很难在市场总量上竞争过手机相机。但是难用,也不至于用不了,同时加大力度(成本)、长期推广,通常是可以解决的。生态需要的是时间,需要的是行业的齐心、互利与共识。但是当所有人都担心自己的付出被别人薅羊毛了,怎么办呢?
1.2芯片的本身设计
设计芯片会影响芯片的性能、稳定性和成本,例如CPU/GPU/AI芯片跑的快慢,似乎是可以容忍的和通过价格进行权衡,但不会直接冲击国民生计。而且经过行业长期积累和知识人力的流动(例如初创公司/团队靠挖先进企业人才推动项目进展以及那么多大牛跳槽来来回回),其实普遍的设计/优化思路在行业内是有大致思路的,关键在于细节罢了。许多很“梦幻”的名词与概念实际上已经出现了十多年了。另外目前除了限制名单内的部分企业,大多数企业也大量(数量与金额)外购IP核(可以比喻成:别人设计好的“小模块设计”)。所以直观讨论下来,芯片设计或许小步慢跑、给些时间、给些资金,一点点追上先进水平就好了,卡脖子似乎并不严重(主要是其实很难卡住设计思路的脖子的,因为基本也没人会把设计优化思路“租”或“卖”),国产替代主要意义在于国防军工、国计民生行业,同时从外国企业抢回来部分经济利益、避免被远远抛下出现突然“断粮”的严重问题。不过芯片设计优化追赶过程中,我们跑,别人也跑,往往需要有根本性的、原理架构层面的突破才能超越。因此大概设计需要的是人的灵感、知识(脑洞),短期内解决方案可以天价花钱挖人、买IP,长期内解决方案还是需要培养人。
1.3芯片的生产工具与设备
生产芯片与上面两者的区别是,我感觉这个卡脖子是更实在的,因为它直接决定了国内有没有自立能力,不管你多会种粮食,种子直接不卖给你。而困境上看似乎是生态与设计的困境的整合,缺人才、缺时间、缺生态/引导。
(1) 缺人,相对于其他软件、硬件方向,国内就没多少芯片实际生产与工具链有关的研究实验室,毕竟是小众方向。作为备份存在的一些项目,真的长期是当成备份,不会停止支持,但也不会鞭策发展。如果是备份的氛围,是不太可能有发展动力。虽然是小众方向,理应不至于人才少得离谱。3年前回本科学校与老师交流,老师列了一个单子,以数字电路为例子,在写完Verilog(一种硬件描述语言)后,每一个环节有哪些国内的公司/学校实验室/老师在做,我震惊于仿真器、逻辑综合这么靠前端的内容,竟然也如此少关注,何况后端布局布线和生产相关环节。
(2) 资金,我个人觉得相较于芯片设计企业动辄数十/百亿,是不是特别缺,除了涉及底层材料与设备研发会有高额的配置需求外。主要是风险高,收益周期长,专业人员少,导致资金投入的“谨慎”。
(3) 缺时间,涉及到底层由于工具链/生产原理的复杂性,需要大量的磨合与试错,每一轮迭代都是季度/年月计数。缺生态/引导,工具链/生产链是“链条”,是需要对接、认证、信任的。一个新生的某个工具/设备,没有办法对接入链条是没法运作的,这个最初的尝试需要上下游分别承担代价来实现对接的,而并不是每个上下游环节都愿意承担这些风险和成本的。认证与信任,很多时候是一个正反馈,用的人多了,才能有更多人“敢”用和“愿意”用,更多人用了,工具/设备才能不断优化。感觉国内的工具与设备链条,很难再走SCM三大家EDA工具厂商或ASML的几十年收购的形式来完成生态链条构建了,或许在最开始就要把这些链条计划好分工、标准对接好、同步发展,搅动几下,才能让这个发动机自己动起来。
1.4小结
1.1中的生态目前国内每个芯片设计公司都比较排外,没有协商一致、协同共享的趋势,哪怕所谓的技术标准,认可度与参与度不高,对于1.3中的生产工具与设备,主要芯片设计公司考虑的还是反正被封闭制裁的又不是我们。所以导致1.2中的芯片设计突破缓慢且实际还是牢牢地被把控在外部的温水煮青蛙的环境中。
2. 公司类型:春秋战国诸子百家还是晚唐蕃镇割据?
随着2019年的打压刺激与2021年的芯片供不应求,国内集成电路迅猛发展,各类企业雨后春笋。对于我个人这个方向的从业人员,自然是喜闻乐见。从我的角度来看,芯片设计公司可以分为传统集成电路厂商、互联网/手机/车企造芯、创业公司,而芯片工具/生产链公司我主要沟通的是创业公司。
2.1 传统集成电路厂商
传统集成电路厂商通常就是以来硬件本身获得企业利润的,一旦硬件供给不能延续会有重大生存困难,没有硬件不行。它们大部分都是经过了十到二十年的发展,自成体系,链条与产业方向也似乎比较明确,不过在和一些企业的同事沟通时,是能够体会到这些厂商中的长期方向上的一些迷茫氛围(如技术发展路线、产品的应用铺展等等)。企业特点上看:
(1 )这些企业有非常宽的产品系列
(2) 有相对完善的半导体/超大规模集成电路研发流程、软硬团队配置和风险管理机制,部门内部分工细化,同时对接的上下游生态环节也比较多而全面
(3) 不过“部门墙”会比较厚重,部门之间的信息传递和协作的成本会比较高(如软硬件部门之间),某些硬件的软件层面的“可用性”/“便利性”还有可以提高的地方,某些硬件的设计可能会让后期介入的软件上层难以下手。毕竟普通用户可能没有那么多时间与知识背景去充分发挥某些芯片的威力,或许这是国内传统集成电路厂商可以进一步优化的地方。
2.2 互联网/手机/车企造芯
互联网/手机/车企造芯则是通常为了本公司的业务的,因为这些公司的自身产品中,涉及到硬件(如服务器集群CPU、网卡、GPU、手机SoC、车用MCU等),这些芯片本身不是这些公司的主要利润来源,而是用来保障自身的某些净利润率高的主体业务,避免受到上游垄断地位供应商的完全控制。对于它们而言,丧失某些硬件供给不会马上对主体业务出现重大冲击,有硬件比没有好。因此企业特点上看:
(1) 对硬件部门的宽容度稍微更大一些
(2) 同时有相对较强的软件团队支持(也有很强的软件需求),因为此类企业/部门通常会有大量开发者会在上层使用芯片,因此软件效率影响很大,
(3) 因为容错程度更高,会进行一些灵活大胆的尝试
(4) 但组织架构与项目管理不如传统厂商一样稳定和长远。这些厂商通常是最近10年内开始关注集成电路产业,相应部门规模也不算非常大,初期通过从成熟的集成电路传统厂商汲取人才实现起步,后期慢慢针对主体业务提出定制化的解决方案、建立内部品牌、积累自身人才,然后慢慢实现内部的技术迭代循环。
2.3 创业公司
上述两类公司短期内变化应该不大,贡献度与发展步伐也比较明朗的。创业公司方面我分成了设计公司(5家)与工具链公司(8家)进行沟通(生产链涉及设备的我还不了解,也没有太多人际交集,因此没有没能实现相关的沟通学习)。
2.3.1 创业公司:芯片设计方向
这5家芯片设计公司主要都是最近3~4年成立的,在“估值”上达到了数十亿,而目标主要都是各类“算力”,都配备了从生态计算库、编译软件、软硬协同、架构、RTL设计、验证、物理实现、高频接口、先进工艺等一系列部门团队。这些公司的出现,能填补传统厂商在细分领域的部分不均衡,同时更专注地培育某些方向的人才队伍。此外可以吸引一些投资到这些领域,以及作为中转机构,把社会资金资源进一步向研究院校倾斜转移。针对这些设计公司,我主要思考的是两个问题。
第一个问题,从产品定位与优势定位上,我个人觉得是高度同质化,也是我比较忧心的部分。我想芯片内部架构的突破会才能有绝对的优势,其余部分我认为大家实力没有太大差异,另外国内高算力通用芯片和专用芯片早已有多年的相应企业,究竟新生企业优势在哪呢?而在交流中我谈及同质化问题如何解决时,主要获得的回应可以分为3类:
(1) 资本更雄厚,足够大规模招人与IP组合购买;
(2) 有特定客户群体支持,某些在建数据中心集群说好了会买芯片板卡;
(3) 强大的团队,执行领头为某些先进企业的管理层。
这三点并没有谈及架构的突破和领先优势,沟通中的内容似乎只是延续部分执行领头过去以往的技术路线,结合一些现成IP完成初始迭代,当然也有看可能部分交流对象主要从事代码开发工作或者出于涉密考虑,并没有提及架构优势。(1)中的资本愿意出钱是因(2)与(3);(2)的操作看起来更像是附属于某些上市公司的硬件子公司,很大概率上是不能促进芯片生态的构成的;(3)有些许希望能带来架构突破,但除了很强的大脑,实现上还是需要底下成熟的团队解决,当然成建制的挖人也是一个办法,但是其实并没给国内产业突破带来很大变化,只是一群人换了一个地方工作罢了,另外队伍出现“混编”时,如何避免风格与决策上的冲突也很有挑战。因此(2)(3),似乎并不能解决生态与实现短期突破,而生产问题在这些企业看来目前似乎还不是主要困扰,因为目前产量都非常低。
第二个问题是,我个人主观觉得5年的短期内的“算力”不足不太可能靠芯片设计解决,毕竟这么多年AI芯片一波一波地出现每个性能都比别人“高2~10倍”,很多时候似乎是文字/数字游戏(如强定制化、测试基准不一致、相关产品并外部不能容易获得)了。我个人觉得解决算力在5~10年内可能还是依赖量产,一方面需要协调设计从而提高良率,另一方面需要的是Fab如台积电、中芯国际开大马力,生产量提高了,成本可以摊开,更便宜、更大量则更有利于生态建立。但在台积电、中芯国际的有马力有限的5~10年内,先进工艺的产能肯定还是会被苹果/NVIDIA / AMD/高通等大需求订单填满的,另外一旦有突破,开始怎么确保不会被外部势力从生产一侧源头打击?另外有点担心,企业可以2B可以2C可以2VC,但是涉及重要产业还是希望国内能够稳扎稳打,而不是“高举高打”。因为这些压根不是“赛道”的问题,而是“责任”的问题。
2.3.2 创业公司:芯片设计工具方向
这8家工具链方向的公司的大致业务分别:4家涉及后端(ASIC/FPGA布局布线),5家涉及前端验证加速(软件仿真、硬件仿真、其他用于验证的工具与IP库),2家涉及偏更后端(布局布线后的环节),注意部分公司的业务有多个。因为时间关系还没找逻辑综合相关的企业沟通学习。而这些企业的诞生,部分是院校转化、部分是某些硬件公司的软件工具子公司、部分是原本国外领先的EDA公司的团队回国创业。另有有些创业公司是提供架构或描述层面的流程或设计的自动优化方案,因为我主要关心逻辑综合与其之后的环节,所以并未进行沟通。沟通上有一种感受,就是工具链/设备链的初创团队大多很有使命感与情怀。
2.3.2.1 前端验证
从创业方向上看,验证(Verification)加速是明显多一些的,从我沟通中了解到的信息看,原因可能可以分为四个方面:
(1)从业务实现上来看,验证对其他环节的工具链比其他工具链方向的依赖度低一些,验证方向的开源社区相对更活跃与普及,相关工具与代码的基础容易构建;
(2)从可行性与风险上看,主流EDA公司如三大家或Altera/Xilinx,提供了通用工具和IP库,而主要创业公司通常需要做的是进一步优化效率速度与提供更加定制化的服务;
(3)从用户角度上看,对于前端/架构的设计,验证的主要原理、方式、指标都是可知可控的,同时介入研发流程的难度比其他环节要低,第三方创业公司可以提供更贴近的定制化服务;
(4)基于(1)-(3)上面三点,原理直观、风险可控、收益通常只要大力就能出奇迹,因此对于投资人也更为友好
从交流过程中看,偏硬件的验证方向初创企业,与他们匹配的软件的大规模项目管理、可用性与效率目前还很需要时间发展与优化,而偏软件的验证方向初创企业,软件功能还需要大量的应用/硬件测试来支撑“可信度”。另外这个方向也是存在一些轻微的同质化风险。
2.3.2.2 后端物理实现
涉及后端(布局布线及其之后的流程)的初创企业体量都不大,几乎都是院校转化与回国创业团队。后端的难度在于:
(1)它们跟工艺与设计高度相关,细节决定成败,换了测试应用/评价指标/工艺约束,就会导致显著差异;
(2)跟上下游工具链软件也高度结合,因为EDA上下游经常需要协同优化,例如布局需要考虑布线的可行性等;
(3)方法论与先进解决方案大多是主流EDA厂商几乎不公开,需要大量的摸索;
(4)工具的检验与测试困难,与互联网企业或者普通软件开发不同,涉及到大规模电路的复杂性,通常写工具的人,不太能直接确定最终的实现效果(即很难做到所见即所得,你以为算法逻辑上没问题,但是可能某些细节会出问题)。因此通常需要到最终(多次)成功后仿或(多次)成功流片,才能说某个后端工具是可靠的、稳定的,在这之前通常非常难以获得订单;
(5)后端人才储备肉眼可见的少,看一下EDA会议涉及后端研究方面的论文,相对于国外,国内产出是很少的,不论是弯道超车与直线追赶都需要更多的重视和支持;
(6)因为链条复杂性与有些难以大力出奇迹的因素,收益难以预计,高风险下,投资会相对谨慎。
因此,后端工具链公司的发展,需要全产业链的支持,同时需要设计公司/生产厂商的信任,例如需要设计公司提供大量的测试用例,需要生产厂商及时提供工艺细节等等,而设计公司与生产厂商有时候并不完全了解EDA的算法原理、问题形式、可行性与局限性。因此,为了长期发展,目前这些企业也或多或少和院校保持协同推进的互动。一些高起点一些的后端公司会存在新生力量不了解底层机制或难以下手大规模地对业务整体框架进行优化,一些低起点的后端公司则不可避免地需要走过高起点企业的路,积累经验和形成技术壁垒。
2.4 小结
路漫漫其修远兮。从我的角度来看,芯片设计公司或许需要时间厚积薄发来找弯道超车的路子,工具链/设备链需要有合理的规划以及上下游的配合进行方案集成。希望这个寒春撒下的种子,来年是满山傲雪梅花。
3. 技术之外的一点思考
上面的内容是还是相对偏技术的思考,或者说我作为博士生,在调研中比较感兴趣与侧重的内容。不过在沟通中,一些前辈和朋友也谈到了技术之外的一些东西,也启发了我一些思考。
3.1 投资分布:追求低风险和高回报是资本的本性,但与行业部分节点特性矛盾
资本参与是行业发展的重要环节。但资本是逐利的,并不应该用家国情怀和社会责任感的标准来要求它们。
行业的繁荣是需要一定乐观泡沫的。我担忧的是:
(1) 泡沫之下能不能更高效率地积累国内的技术水平,在资本的压力下,集成电路企业本身是否能够高效地利用资本的价值;
(2) 资本并不是直接了解技术与行业需求的,在资本的“引导”下,行业是否会出现劣币驱良币。我想可能的投资造成驱良币的三个情况:a)前期企业利用半导体研发的“长期性”(3~5年才能出产品或者量产),吹高一些概念与指标,使得行业混乱;b)中期企业融别人的资,让别人无资可融,融资竞争,而非技术竞争,不过最近两三年或许人脉通就钱是管够的了;c) 后期企业大量融资、高目标下后部分产出不及预期,随后打击行业投资信心,从而影响其他企业的融资活动。
(3 )从目前的情况看,越是“卡脖子”的环节,投资越少。因为能“卡脖子”这么多年没解决,说明难度大、风险高或者周期长、收益低,还有一些生产/设备厂商是资本密集型,这对普通的民间资本并不是理想的投资标的。但是不巧,对于目前国内社会的长期发展而言,越是“卡脖子”的环节,投资应该越多。嗨,真是无奈的现实,毕竟别人集成电路的资本是几十年利润积累下来的,短期内这些近期大手笔的资本投入只能靠国家手段了。企业当然要为投资的股东服务,但是变成了估值导向的发展和急于利益变现,可能会扭曲初心,未必对长期发展有益呢。
3.2 政策指引:事前、事中、事后
就如同硅谷的成长,离不开企业家、技术、资金、政策引导。在我们目前落后、外部封锁、期望追赶的情况下,一个“有形”的手显得格外重要。
感觉地方政府在事前除了制定目标,还需要有真实、细致的调研。真实是指“问是不是”,细致是指“怎么样”。这实际上是有困难的,最没有“成就感”的事情,但是确实是最重要的。2年前一位朋友请我帮忙,审阅一下某个创业团队的园区资金与场所支持的申请,PPT上的内容如果让本科时候我来看,就会觉得非常闪耀,但是经过这几年的导师不断地锻炼,能够看到许多空洞的内容。例如创业目标涵盖了某个方向,但是实际上这个方向的每一个细分领域都很多挑战,与他们实际团队的背景与能力并不符合。例如没有初始的产品或者原型展示,仅仅“想做”层面的想法或者文字上的“更高更快更强”或者“这个利润率高”,在集成电路这些方向其实不太靠谱,尤其这些涉及技术门槛而不是商业模式的创业。例如用以体现自身领先的对比企业里面,忽略了最近几年比较成功或者类似的企业等等。通过那份PPT,我能想象到那些审阅委员会过滤出那么多领域中的可靠的项目有多不容易,看到来头不明的集成电路企业找政府融资上十几亿,然后爆雷,好心痛纳税人的辛劳。
另外上述几个集成电路环节,其实是可以看到环节之间是高度依赖的,而只要一个链条断了,整个流程都好不了。目前环节之间主要依赖企业之间的默契相互协调,间歇性地能看到不同的主办方和参与者开设协调工作会议,间歇性/不同的是这个现象的关键词,信任和利益协调真的太难了。然而实际上,外部的困难是明显的温水煮青蛙,不煮青蛙不能吃,水太烫了,青蛙就会跳走。目前这些困境不是几个企业之间的问题,实际上是整个国内行业的根基心病,在这个层面,有形的“手”推着各个环节参与解决问题中。因为,每个用心发展的企业,终究都会碰到那个透明的天花板,未雨绸缪才能不被变成被痛打的落水狗。
有调研、有目标、有计划,事中事后还需要合理监管的,例如计划如何踏踏实实地推进,在保守商业秘密同时、指标如何检验、实际效果如何。“专项”这个概念在沟通过程中被不同的人反复提到,被提到的方式通常是“这些的的确确能够有力地促进一些单位去实现某个目标,但是问题是,一旦专项的目标变成指标的数字和文字,而实际上到落地使用的实用化还是有比较大的距离。”其中一位前辈还打比喻“这就好像咱们造了个跑车,时速1000千米每小时,完成了最高速跑车的设计。目标完成。至于它烧的是液氧液氢而且车内温度1000摄氏度没法坐人,就不是关心的地方了。”国内的集成电路圈子很小了,如何有效监管审视、同时避免死板地打击灵活性和创新活力的确很有难度。或许给出踏实的目标,低头看路,小步快跑,努力加油会比较实在。
编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !