全球首款Transformer专用AI芯片Sohu发布:比英伟达H100快20倍
快科技6月26日讯据媒体报道,美国新兴的芯片创业公司Etched发布其首款AI芯片——Sohu。
该芯片在运行大型模型时表现出惊人的性能,超过行业巨头Nvidia的H100高达20倍。即使与今年3月份才推出的顶级芯片B200相比,搜狐也展现出了10倍以上的优越性能。
搜狐芯片最大的突破在于将Transformer架构直接嵌入到芯片中。据Etched负责人Uberti介绍,搜狐采用台积电先进的4纳米工艺制造,不仅在推理性能上远超GPU等通用人工智能芯片,而且在能耗控制上也达到了新的高度。
对于Transformer技术而言,Sohu无疑是目前市场上最快的芯片,其性能与其他产品之间存在显著的量级差异。值得一提的是,目前ChatGPT、Claude、Gemini、Sora等主流AI产品都是由Transformer架构驱动的。
作为全球首款Transformer ASIC(专用集成电路)芯片,搜狐的集成应用更是引人注目。根据测试,配备8颗搜狐芯片的服务器的性能可与160个H100 GPU的集群相媲美。
具体而言,集成8块Sohu芯片的服务器每秒能够处理高达50万的Llama 7B tokens,这一数据在业界堪称前所未有。
创造出这款出色芯片的Etched 公司位于美国加利福尼亚州库比蒂诺。虽然成立才两年,团队规模只有35人,但其创始人是——哈佛辍学生Gavin Uberti(前OctoML和前Xnor.AI员工)和资深技术专家Robert Wachen共同领导的Chris Zhu赛普拉斯半导体前首席技术官马克罗斯,成功研发出这款专为大模型AI设计的芯片,展示了其强大的技术实力和无限潜力。