当前位置: 首页 > 资讯 > 科技 > NASA携手IBM共创新篇章:INDUS大语言模型赋能尖端科研探索
  • 0
  • 0
  • 分享

NASA携手IBM共创新篇章:INDUS大语言模型赋能尖端科研探索

NASA 2024-06-26 13:57:42 爱吃爆米花

近日,美国国家航空航天局(NASA)的跨机构实施与先进概念团队(IMPACT)宣布了一项开创性合作,与多家私营及非政府组织伙伴依据太空法案协议,共同推进名为INDUS的大规模语言模型项目。

这一创新举措旨在打造一个专精于多学科科学研究的智能工具,覆盖范围广泛,包括但不限于地球科学、生物学、物理学、日球物理学、行星科学及天体物理学等深奥领域。

INDUS 包含两种类型的模型:编码器和句子转换器。编码器将自然语言文本转换为数字编码,可以由 LLM 处理。INDUS 编码器在包含天体物理学、行星科学、地球科学、日球物理学、生物科学和物理科学数据的60亿令牌语料库上进行了训练。

IMPACT-IBM 合作团队开发的自定义分词器通过识别生物标志物和磷酸化等科学术语,改进了通用分词器。INDUS 中超过一半的5万个词汇是针对其培训所使用的特定科学领域而独有的。INDUS 编码器模型被用于对约2.68亿个文本对进行微调,其中包括标题 / 摘要和问题 / 答案。

通过为 INDUS 提供领域特定的词汇,IMPACT-IBM 团队在生物医学任务基准测试、科学问答基准测试和地球科学实体识别测试上,实现了比开放、非领域特定 LLM 更出色的表现。通过设计多样化的语言任务和检索增强生成,INDUS 能够处理研究人员的问题、检索相关文档并生成答案。对于延迟敏感的应用,该团队开发了更小、更快的编码器和句子转换器模型版本。

验证测试表明,INDUS 在回答 NASA 约400个问题的测试集时,能够从科学文献中检索出相关段落。IBM 研究员 Bishwaranjan Bhattacharjee 评论了整体方法,“我们通过不仅拥有自定义词汇,还拥有大量专门的训练编码器模型和良好的训练策略来实现了卓越的表现。对于更小、更快的版本,我们使用神经架构搜索来获取模型架构,并使用更大的模型监督进行知识蒸馏进行训练。”

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/59740.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热门游戏
换一换
热门软件
换一换