当前位置: 首页 > 资讯 > 科技 > 微软新模型LAM:AI在Word里开启真实操作新时代
  • 0
  • 0
  • 分享

微软新模型LAM:AI在Word里开启真实操作新时代

微软(Microsoft) 2025-01-05 11:06:59 爱吃爆米花

近日消息,微软的研究团队近期推出了一款被命名为“大型行动模型”(Large Action Model,简称LAM)的人工智能技术成果。这一成果的出现,预示着AI的发展步入了崭新的阶段。

LAM 的优势在于其能够理解用户的各种输入,包括文字、语音和图像,然后将这些请求转化为详细的步骤计划。LAM 不仅能制定计划,还能根据实时情况调整其行动策略。

构建 LAM 的过程主要分为四个步骤:首先,模型学习将任务分解为逻辑步骤;接着,通过更先进的 AI 系统(如 GPT-4o)学习如何将这些计划转化为具体行动;然后,LAM 会独立探索新的解决方案,甚至解决其他 AI 系统无法应对的问题;最后,通过奖励机制进行微调训练。

在实验中,研究团队以 Mistral-7B 为基础构建了一个 LAM 模型,并在 Word 测试环境中进行测试。结果显示,该模型成功完成任务的概率为71%,相比之下,GPT-4o 在无视觉信息的情况下的成功率为63%。

此外,LAM 在任务执行速度上也表现优异,每个任务仅需30秒,而 GPT-4o 则需要86秒。虽然在处理视觉信息时,GPT-4o 的成功率提高至75.5%,但总体来看,LAM 在速度和效果上均有显著优势。

为了构建训练数据,研究团队最初收集了29,000对任务和计划的示例,这些数据来自微软文档、wikiHow 文章和必应搜索。之后,他们利用 GPT-4o 将简单任务转化为复杂任务,从而将数据集扩展到76,000对,增加了150%。最终,约2,000个成功的行动序列被纳入到最终的训练集中。

尽管 LAM 展示了其在 AI 发展中的潜力,研究团队仍然面临一些挑战,如 AI 行动可能出错的问题、监管的相关问题,以及在不同应用中扩展和适应的技术限制。不过,研究人员相信,LAM 代表了 AI 发展的一次重要转变,预示着人工智能助手将能更积极地协助人类完成实际任务。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/108327.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热榜
热门游戏
换一换
热门软件
换一换