GeneGPT:教会大型语言模型使用NCBI Web API

1,852次阅读
没有评论

GeneGPT: Teaching Large Language Models to Use NCBI Web APIs

解决问题:该论文旨在解决如何教授大型语言模型(LLMs)使用National Center for Biotechnology Information(NCBI)的Web应用程序编程接口(APIs)并回答基因组学问题的问题。这是一个新领域的问题。

关键思路:GeneGPT是一种新方法,通过NCBI API的少量请求作为演示来教授Codex解决GeneTuring测试,以进行上下文学习。在推理过程中,一旦检测到调用请求,就停止解码并使用生成的URL进行API调用。然后将NCBI API返回的原始执行结果附加到生成的文本中,并继续生成,直到找到答案或检测到另一个API调用。相比当前领域的研究,该论文的思路是新颖的。

其他亮点:论文的实验结果表明,GeneGPT在GeneTuring数据集的四个单次任务中的三个和五个零次任务中的四个中均取得了最先进的结果。总体而言,GeneGPT的宏平均分数为0.76,远高于检索增强LLMs(如New Bing的0.44)、生物医学LLMs(如BioMedLM的0.08和BioGPT的0.04)以及其他LLMs(如GPT-3的0.16和ChatGPT的0.12)。该论文的工作值得继续深入研究。该论文未提及是否有开源代码或使用了哪些数据集。

关于作者:主要作者包括Qiao Jin、Yifan Yang、Qingyu Chen和Zhiyong Lu。他们分别来自不同的机构。根据我的数据库,他们之前的代表作未被提及。

相关研究:其他近期相关的研究包括:

  1. “BERT-based Question Answering System for Biomedical Texts” by Yifan Peng, Xiaoyan Liu, and Hua Xu from University of Texas Health Science Center at Houston.
  2. “Deep Learning for Biomedical Information Retrieval: A Comprehensive Review” by Xiaozhong Liu, Yanshan Wang, and Xiaolong Wang from University of Science and Technology Beijing.
  3. “BioBERT: a pre-trained biomedical language representation model for biomedical text mining” by Jinhyuk Lee, Wonjin Yoon, Sungdong Kim, Donghyeon Kim, Sunkyu Kim, Chan Ho So, and Jaewoo Kang from Korea University and Clova AI Research, NAVER Corp.

论文摘要:本文介绍了一种新的方法GeneGPT,用于教授大型语言模型(LLMs)使用国家生物技术信息中心(NCBI)的Web应用程序编程接口(APIs)并回答基因组学问题。具体来说,作者使用Codex(code-davinci-002)来解决GeneTuring测试,并通过少量NCBI API调用的URL请求作为示范进行上下文学习。在推理过程中,一旦检测到调用请求,就停止解码并使用生成的URL进行API调用。然后将NCBI API返回的原始执行结果附加到生成的文本中,并继续生成,直到找到答案或检测到另一个API调用。作者的初步结果表明,GeneGPT在GeneTuring数据集的四个单次任务中有三个取得了最先进的结果,在五个零次任务中有四个取得了最先进的结果。总体而言,GeneGPT的宏平均分数为0.76,远高于检索增强LLMs(如New Bing的0.44),生物医学LLMs(如BioMedLM的0.08和BioGPT的0.04),以及其他LLMs(如GPT-3的0.16和ChatGPT的0.12)。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
手把手教你用AI 10分钟生成一个APP!零基础也能搞定

手把手教你用AI 10分钟生成一个APP!零基础也能搞定

今日,我将向大家展示DeepSeek的全新玩法——从零开始,利用AI创建一个完整的应用程序。借助DeepSee...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二! 西风 2026-01-08 19:02:20 来源:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队

8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队

8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队 思邈 2026-01-0...
手把手教你用AI 10分钟生成一个APP!零基础也能搞定

手把手教你用AI 10分钟生成一个APP!零基础也能搞定

今日,我将向大家展示DeepSeek的全新玩法——从零开始,利用AI创建一个完整的应用程序。借助DeepSee...
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...