电子工程师成长实录之教训系列之五
常言道人靠衣衫马靠鞍,在一个拼颜值的社会,外观和结构设计对电子产品也变得越来越重要。消费类电子不用说,即使是工业类电子产品,外观靓丽、结构精巧的产品也会让产品更具竞争力。在多年的项目开发中,关于外观结构设计方面我就有过一次失败教训,每每想起还是记忆犹新。
那是十多年前,我带领团队从事网络流媒体智能监控系统的硬件研发和生产工作。系统采用世界首颗基于MPEG-4硬件压缩处理芯片,美国国家半导体的486主控平台,以太网和ADSL通信方式,具有音视频同步、本地数字化和网络传输、高达300:1数据压缩比、DVD画质等诸多优点,和当时传统的采用多DSP软解压方案相比具有明显技术优势。团队由电子、机械结构、测试、产品化及生产工艺等工程师构成,负责从研发到大规模量产全部工作。公司正准备去香港上市,而且预交了在北京举行的一个大型展会相关费用,项目的研发进度必须要保证。因为采用技术过新,团队克服了蓝屏、音视频分离、闪屏等重重困难,完成了原理样机验证,接下来就是工程样机研发。
工程样机研发阶段就需要考虑很多工程化的因素,而首当其冲的就是外壳和结构定型设计。那时没有3D打印,CNC快速打样也很昂贵,基本都是确认原理样机功能满足要求后才正式开始外壳设计和开模等。基于时间和经济性考虑,主要是开模周期及费用问题,首先排除了塑料外壳开模;考虑到批量产品单价问题,进一步排除了铝合金外壳;最终决定采用钣金冲压模外壳。
接下来就是根据电路板尺寸及散热需求决定了外壳的外形尺寸和安装方式;根据电脑效果图选择了一款简洁的矩形设计,采用黑色钝化工艺,大红色Logo;考虑到工业级产品现场安装和使用时的防护强度采用了比较厚实的板材。因为距离参展的时间太紧,直接下了几十套进行小批试制。然后,经过无比焦虑的催促和漫长等待后,终于在必须启程去北京布展前两天外壳到了。
所有的人都惊呆了,这个外壳真的不是一般的丑,黑乎乎的一块傻大粗笨的砖头,电脑效果图上闪亮的黑色钝化效果由暗淡无光的黑漆取代,笔直的缝线在钣金工艺上根本实现不了,效果图上美丽的大红的Logo在实际套印后显得很突兀,很多地方因为钣金工艺和材料原因都无法达到设计要求。但已经没时间更改了,咬牙带领团队忙碌了两天,最后一天全体熬了一个通宵,这也是我到上海后唯一的一次通宵加班。通过各种胶粘钉铆,在参展团队出发前一刻将测试通过的样品完成交付。 后来的事情可以想见,据参展的同事说,我们的产品是全场最丑的展品,没有之一。痛定思痛,经过彻底改进,终于满足了相关要求,实现大批量量产。
几点教训:外壳的ID设计需要专业的工业设计人员;永远不要相信效果图;尽早启动外壳设计,现在可以充分利用3D和CNC技术。
电子工程师成长实录之教训系列之六
作为电子研发的老兵,面对各种纷繁复杂的问题,加班加点是家常便饭,绞尽脑汁甚至抓狂是常态。经常发现当项目进展到你想砸掉设备的时候,再坚持一步你就成功了。但是有一个项目却因为坚持,到现在每每想起我都心痛郁闷不已。
2006年,我在上海一家公司从事动态令牌的研发生产工作。公司是一家纯软件公司,在我入职前没有硬件部门。作为硬件部经理,负责创建团队、样机研发和后续大规模生产。工作压力很大,但是工作氛围很好,同事们相处很愉快。
当时这个动态令牌的技术正在快速在各行业推广应用,开始主要是用于保障跨国企业的网络登陆安全,2002年就是通过NS的FAE首次接触到这个东西,该技术的先行者是RSA,当时NS就是RSA定制的。后来随着银行的账户密码经常被盗,各大银行也开始推广动态密码器;那几年网络游戏超级火爆,随之而来的是游戏账号安全问题,并因盗号而发生过几起比较轰动的诉讼,网游公司开始陆续采用动态令牌来保障游戏账号的安全。
当时国内从事动态密码器研发生产的公司并不多,而能拥有自主知识产权的公司更少。公司创始人是剑桥大学毕业归国的海归,拥有基于SHA256算法的动态密码的核心专利技术,而SHA256在当时比其他的公司的技术整整领先一代;公司的投资人是美国IDG和5173。 我当时的主要工作就是采用合适的单片机,实现基于SHA256算法的动态密码器。SHA256算法相当复杂,有大量的矩阵和回归迭代运算,对于单片机实现基于时间的动态令牌来说存在以下难点:较大RAM空间;高速计算能力;超低功耗;超高可靠性;超低价格。 由于以上各项之间存在冲突,同时满足这些相互矛盾的需求其实非常困难。
我先在PC机上用C语言编程实现算法,仿真后发现RAM的需求最精简最少也超过2KB,如果移植到单片机上加上各种初始化和控制代码,RAM的需求接近3KB,2006年的时候能有3KB的RAM的单片机极为稀少而且价格极高。不得已,我选择用汇编语言编程,综合运用很多编程技巧,如采用程序空间换RAM空间,多次迭代的RAM动态分配回收等,最终花费了一周时间,将RAM需求降到409Byte,因当时已经有不少单片机的RAM空间达到512Byte,彻底解决了RAM空间不足的问题; 硬件上采用激光焊接锂电池以及晶振匹配和整体固定,软件上由于采用的是汇编语言,计算效率和可靠性远超C语言编程;采用了深度睡眠等技术平均功耗降到3.4uA,一块CR2032的电池可以工作超过3年,达到了超低功耗的要求。
当时有三款满足技术要求的单片机,分别是TI和台湾某公司的8位机、富士通的16位机,由于超低价格的要求,我们选择了台湾的单片机。 很快样机出来了,功能和性能测试OK,1K的样品生产出来了功能和性能都OK,但是经过一段时间后发现存在一定比例的样机功耗很大,电池很快就没有电了。拆开测试,未见异常,换装电池后功能正常;期间怀疑过晶振停振、电池松动、静电干扰、电路板异常、软件跑飞、芯片不良等;多次请供应商及代理商的技术人员一起分析,甚至寄实物到台湾请原厂分析,结论均是未见异常。
在测试分析和不懈坚持中,我又分别将代码成功移植到TI和富士通的单片机,但是这时国内做动态密码器的厂商开始多起来,他们采用的都是上一代简单的加密算法,虽然安全性不够,但对单片机要求很低,而且外观上看不出任何差异。在成本的压力之下,新的单片机导入工作在公司层面一直未能真正进行,生产订单开始源源不断,又掩膜定制50K的Dice片。 坚持了很久,通过对500套样品的排查,终于发现是因为该单片机的内在BUG,P64管脚IO口寄存器配置会在休眠期间发生反转,高低电平一旦反转后就开始快速放电。
问题查清了,但是对公司来说损失已经非常巨大,包括客户流失和口碑等。这是我工作以来遇到的最难复现、最难模拟、最难分析的问题,也是对公司造成影响最巨大的问题。
教训主要有以下几点:
1、 样机开发阶段过于考虑低成本方案往往会导致灾难性后果,优先选择口碑好的大品牌产品完成技术验证和生产销售,然后逐步降本;
2、 如果硬件问题没有得到解决,一段时间后还没有进展需要及时止损,切换不同方案,这时一味的坚持往往付出更加惨痛的代价;
3、 表面上的硬件问题有时其实是软件配置导致,但深层次原因可能还是硬件不良,遇到这种极难复现的问题尤其要当心;
4、不要迷信芯片公司,所谓原厂的技术支持其实是有限的,所谓的分析报告有时无非是一个免责的托词,而且这种深层次的问题很难追责。
电子工程师成长实录之教训系列之七
2010年春节刚过,我受托创建公司的上海分公司,开始从事矿山自动化设备电控系统的研发和生产工作。
第一个项目就是要研发煤矿采煤工作面液压支架电控系统。液压支架是一个高达7米、宽近3米、自重约45吨、单架顶板负重能力超过400吨的庞然大物。全系统需要180架左右的支架组成,在地下几百米深的采煤工作面上形成一个长度超过300米的巷道。支架系统支撑整个工作面,保护人员和设备不受伤害。这个庞大系统还需要随着采煤机的不断移动而移动,具有手工和自动模式。每架支架有多达11组22个关节动作,电控系统需要通过对电磁先导阀的精确控制进而控制液压主阀,最终控制支架按照实际生产需求进行各种动作或是成组甚至是全系统自动运行。系统安装在采煤机作业现场,是井下生产人员最集中、爆炸性气体和粉尘最严重、空气最潮湿并有强烈腐蚀性的地方,需要高度的安全性,采用本安防暴设计,外壳防水等级达到IP65。行业内一位老教授曾说过液压支架电控系统是煤矿自动化设备中最复杂的电控系统之一。
液压支架系统井下现场图 组建之初,一个人、两间空办公室、四张工作台、一本德国玛柯的系统操作说明书和一些简单的预研资料就是全部的家当。我从没接触过自动化设备,更别说矿山自动化设备(^_^),在上海想找到有矿上自动化设备研发经验的软硬件工程师也是极为困难的。 经过大约6个月,团队已经有十多个人,我完成了方案书起草和通信帧格式制定,带领团队研发出15台原理样机,并顺利通过总公司组织的专家评审。
我一点也高兴不起来,因为自始至终有个问题困扰着我。那就是如何保证180架之间的可靠快速通信。可能是因为通信专业出身,从开始就深知这么庞大的实时联动系统稳定可靠的通信是项目成功的关键。原理样机的评审因为样机数量少,大家更关注的是单台设备的控制流程,对于系统级别的通信延时、误码率、可靠性及方案成本等没有太多考虑。
当初调研下来发现国内外屈指可数的几款产品都对技术资料严密封锁,从对操作手册里只言片语的分析,推断出他们采用的都是CAN或PROFIBUS等现场总线,基本都是干线并联加本地串联通信方式。这种方式听起来很好,但实际带来的问题也很多。通过实际走访矿上和深入矿井第一线,这些公司的系统其实都还存在一些通信问题。矿山专用的线缆强度和工艺要求很高,采用双绞线方式抗干扰能力很强,但是需要的通信线芯太多,线缆和接插件加工难度大,采购成本高;采用单线方式结构简单成本便宜但抗干扰能力太弱,通信速度太低。另外采用并行加串行的方式需要至少三个独立通信端口,而通常ARM器件都只有两个CAN接口。在各种纠结中只能摸索前进,为了简化系统软件控制流程和降低系统成本,我们先采用并行CAN总线方案。
原理样机评审结束后,我对系统通信能力的担忧更加强烈,决定重新评估技术方案,经过慎重思考和分析,部分也是总结当年研发动态令牌的惨痛教训,力排众议将方案改成串联CAN总线双绞线方式,彻底放弃并联总线,这意味着团队辛苦六个月的软硬件架构全部推倒重来。
针对大家的不理解甚至质疑,我是这么分析的: 并联CAN总线理论节点超过110个,实际70多个后就需要加CAN Bridge,这个技术难度并不低而且效果未知;
超过300多米和180个节点的规模,并行总线的传输速率要很低,通信误码率很高,系统管理难度很大,而且要精确实现控制器和支架支架一一对应难度很大; 串行方式不存在无法实现的技术难点,通信延时和可靠性要求可以通过提高通信速率和命令分级传输等方式解决;
系统的研发周期会压缩,硬件成本也会大幅度降低; 很快采用新架构的样机研制成功,于2012年10月完成型式定型、2012年底投入沙坪煤矿生产,2013年中投入斜沟煤矿生产。国内外技术资料的封锁带来的最大好处是我们拥有完全自主知识产权,不过采用了uCOS-II没有付费(^_^)。
几点经验教训: 1、 项目负责人不能因循守旧或存在思维定势,应因地制宜选择自己团队最有把握实现的技术方案; 2、发现项目存在难以克服的技术问题时,即使面临全部工作推倒重来也在所不惜,而且应该越早越好,这些损失的时间会因为方案优化调整而弥补回来; 3、集思广益没错,但是作为技术领头人需要综合平衡各种因素,关键时刻需要也要敢于拍板决策,犹豫不决会导致更加后续更加被动。
电子工程师成长实录之教训系列之八
对公司来说,生产销售的产品有时难免存在质量问题,一般来说,软件BUG最容易处理,升级一下版本就解决了;外壳部分通常是掉漆变形等影响外观但不影响正常使用;电子部分如果出现质量问题往往就会涉及退货、召回等售后服务,经济损失巨大;如果是因设计或制造缺陷,产品在存储或使用中冒烟、起火、爆炸等安全问题就是灾难了。Note7的电池起火事件对三星公司就造成了巨大打击。这些年来我也亲身经历过两次产品的电池起火事件,至今心存余悸。 当年在研发生产某型号电子设备时,需要定制一批红外遥控器。去深圳考察了好几家专业的遥控器厂商,通过对比测试,最终选定一家供应商。遥控器比较普通,采用机顶盒公模,只是按键的功能重新分配了一下。样品测试OK,在公司老板一再压价后最终以极低的价格正式订购2000套。正式产品到货后发现和样品不同,整体变轻变脆而且手感很差;电池盒处没有了电池之间的分隔板;用于电池正负极接触的弹簧变软而且很多焊接歪斜。联系供应商得到的说法是原来的模具坏了,这是采用另外的模具生产的。并且信誓旦旦的保证这套模具生产的产品已经大批量供货从没有客诉品质问题。因为销售等不及了,老板要求工厂先挑选1000套用于发货,而且为了产品形象和以后向供应商索赔(老板原话)否定了我们加胶固定弹片的建议。 发货后不久接到用户投诉,他将我们的遥控器放在皮沙发上,居然遥控器自燃了,将崭新的沙发烧焦一大片,好在发现及时没有造成更大火灾。看到客户发过来的图片,电池部分已经烧焦变形严重。经过分析,缺少分隔板的两节电池安装歪斜加上弹片和弹簧的品质等因素,两节电池正负极短路后发热直至起火燃烧。 直到这时,公司才意识到问题的严重性。立即答应客户的索赔要求;逐个联系客户提示风险,对于担心安全的客户无条件退货;不惜成本紧急订购新的遥控器快递给所有用户。一番折腾,损失惨重。 我们的产品售价是1499元,遥控器供应商报价是每只四元,实际采购价不到三元。遥控器供应商只答应退货,其它一概不管。后来了解到所谓的模具坏了纯属谎言,他们是觉得价格太低,转包给其它的小公司生产了。 后来在另一家公司,参与处理过两起锂电池自燃着火事件,一起烧坏了地板,一起烧坏了桌面,好在因为产品外壳是阻燃材料,未导致更大的火灾。技术分析发现锂电池电芯有品质问题,电池保护板参数设置不合理,更要命的是居然没有过温保护功能。深究原因还是因为成本问题。
这两件事给我的教训: 电源无小事,出事很要命; 成本很重要,安全更重要; 电子工程师在面对成本压力时很无力,但还是应该尽量坚持品质优先; 再低的价格也有厂商接单,但品质嘛,只能是呵呵呵呵了。
全部0条评论
快来发表一下你的评论吧 !