
IT之家 11 月 25 日音尘,科技媒体 livescience 昨日(11 月 24 日)发布博文,报说念称来自芬兰阿尔托大学的参议团队班师演示名为“并行光学矩阵-矩阵乘法器”(POMMM)的新一代光学蓄意基础架构,旨在贬责东说念主工智能(AI)模子熟习和奉行中的中枢瓶颈。
IT之家征引博文先容,当代 AI 模子,尤其是大说话模子(LLM),其性能受限于处理“张量”(Tensor)数据的速率。
Tensor 是 AI 模子顶用于组织数据的加权结构,处理速率的上限平直决定了模子界限的上限。POMMM 架构的出现,为顽固这一限度提供了全新念念路。
传统光蓄意诚然在小界限下比电子蓄意更快、更节能,但存在一个致命颓势:难以并行处理。与不错大界限串联以指数级进步算力的图形处理器(GPU)不同,大大都光学系统只可线性来源。
因此,尽管光蓄意后劲强大,但建立者精深倾向于遴荐 GPU 的并行处理上风。像 OpenAI、Google 等公司建立的顶级 AI 模子,恰是依赖数千块 GPU 并行来源才得以杀青。
POMMM 技巧大约应用单次联系光的传播经由,完成通盘矩阵与矩阵的乘法运算。其中枢旨趣在于,通过空间光调制器将数字张量编码为光的相位和振幅,光束穿过杀青傅里叶变换的透镜组后,运算成果以干预图像的体式被高速探伤器捕捉。通盘算术经由在光的“翱游”中眨眼间完成,无需电子环路或内存读取,杀青了物理层面的“当然同步蓄意”。
参议团队基于现成的光学元件搭建了原型机,在法度光学平台上耗时六个月完成拼装。测试成果流露,关于最大 50x50 的矩阵,该原型的平均皆备误差(MAE)低于 0.15,归一化均方根误差(RMSE)则保抓在 0.1 以下。
这一精度已能温暖好多边际推理当用的需求。尽管刻下原型机的能效仅为 2.62 GOP/J(每焦耳奉行 26.2 亿次操作),远低于顶尖 GPU,但后来劲强大。团队强调,这项技巧的上风在于其推广性与速率,运算蔓延可达纳秒级,远胜于电子蓄意的微秒级。
为了加快技巧考证和社区发展,参议团队已在 GitHub 上盛开了整个代码和数据。这种透明化的作念法增强了外界对该技巧顽固的信心,并诱导了公共光子学实践室和 AI 加快器建立者的存眷。
参议东说念主员指出,探伤器的动态范围和校准漂移是当今需要攻克的清贫,但将来的技巧阶梯图相当显豁。通过将空间光调制器和探伤器阵列等要津部件集成到低损耗的氮化硅光子芯片上,能效有望杀青百倍进步。
凭证团队预测,集成了专用光子芯片的原型机有望在三年内问世,预测能将能效进步至 300 GOP/J,远超电子 GPU 当今约 30 GOP/J 的能效瓶颈。不外,磋商到封装、温控和激光器集成等工程挑战,距离杀青大界限量产可能还需要五年以上的时刻。
IT之家附上参考地址
Direct tensor processing with coherent light AI at the speed of light just became a possibility九游会(中国区)集团官方网站
