当前位置：首页 > 资讯 > 科技 > AMD首推AI小语种模型——“Llama-135m”：革新“推测解码”，RAM占用瘦身新纪元

0
0
分享

AMD首推AI小语种模型——“Llama-135m”：革新“推测解码”，RAM占用瘦身新纪元

AMD 2024-09-29 17:50:42 爱吃爆米花

AMD于9月29日在Hugging Face平台上震撼发布其首个自主研发的“轻量级”语言模型——AMD-Llama-135m。该模型创新性地集成了高效推测解码技术，搭载着惊人的6700亿个token规模，彰显了强大的语言处理能力。更重要的是，AMD选择以Apache 2.0开源许可证分享此模型，促进了AI领域的开放合作与技术创新。

据介绍，这款模型主打“推测解码”能力，其基本原理是使用小型草稿模型生成一组候选 token，然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token，而不会影响性能，从而显著减少 RAM 占用，实现效率提升。

AMD 表示，这款模型在四个 AMD Instinct MI250 节点训练了六天，其“编程专用版本”变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。

扩展阅读

AMD Zen6即将采用台积电二代3nm工艺，2026年才会登场

AMD Zen6即将采用台积电二代3nm工艺，2026年才会登场

AMD 前天

来源：it之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/93148.html

文章标签

AMD

评论

文明上网，理性发言，共同做网络文明传播者

验证码

提交

猜你喜欢

Ghost回顾奇迹夺冠夜：BeryL决赛前夕训练遇挫离场，次日仍携手登顶

电子竞技评论：0 2024-10-04
中国航天科技集团：“航天星闪” 引领航天无线通信技术新突破

中国航天评论：0 2025-01-18

最新

AMD Zen6即将采用台积电二代3nm工艺，2026年才会登场

AMD 评论：0 2025-01-18
《AMD Ryzen Master》更新至2.14.1.3286版本：EXPO内存配置文件无需重启即可应用

AMD 评论：0 2024-12-15
AMD计划明年1月下旬推出锐龙9 9000X3D处理器，继续采用单CCD配3D缓存

AMD 评论：0 2024-11-25
AMD RDNA4后GPU战略大转变：全面转向UDNA，MI400和RX 9000采用同一架构

AMD 评论：0 2024-11-20
AMD推出首个10亿参数开源AI模型OLMo，基于Instinct MI250 GPU集群训练

AMD 评论：0 2024-11-08

显示更多

热榜

百度热搜微博热搜抖音热搜

1国补将上线，怎么买手机最划算

2美国女网友被中国一日三餐震惊：比我们生活得好很多

3女生长相酷似张曼玉走红，本人回应

4王毅表态：绝不允许犯罪分子逍遥法外

5谁懂侯明昊脱衣服一幕含金量，是脱衣有肉的小猫哥啊！

6一喝酒就脸红的人易患两种癌，你中招了吗

7柳岩曾保证一辈子不做第三者，期待回应

8著名导演大卫·林奇去世，享年78岁

热门游戏

第五人格
手游 / 角色扮演
去下载
王者荣耀
手游 / 角色扮演
去下载

换一换

热门软件

微信
应用 / 社交
去下载
支付宝
应用 / 工具
去下载
抖音
应用 / 视频
去下载

换一换