IBM 和 NASA 训练大模型促进科学知识的可及性

IBM 和 NASA 训练大模型促进科学知识的可及性
2024-3-14 16:6:15 Author: www.solidot.org(查看原文) 阅读量:7 收藏

IBM 和 NASA 合作使用科学文献训练大模型促进科学知识的可及性。模型是基于 Transformer 架构，可用于分类到实体抽取（entity extraction）到问答和信息检索等不同应用。IBM-NASA 模型使用了天体物理学、行星科学、地球科学、太阳物理学以及生物和物理科学数据集的 600 亿个令牌进行训练，在评估生物医学任务表现的 BLURB 基准测试中的得分比开源模型 RoBERTa 高 5%。两个模型都开源发布在 Hugging Face 上。

https://research.ibm.com/blog/science-expert-LLM
https://huggingface.co/nasa-impact/nasa-smd-ibm-v0.1
https://huggingface.co/nasa-impact/nasa-smd-ibm-st

文章来源: https://www.solidot.org/story?sid=77593
如有侵权请联系:admin#unsafe.sh