体验完整Gemini

Google官网体验Gemini

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

1,793次阅读

没有评论

今天是2023年10月30日，星期一，北京，雾霾。

我们今天来看看知识图谱与大模型研发过程中的虚与实。

知识图谱讲多一点，10条，大模型少一点，5条。

供大家参考。

一、知识图谱研发落地中的虚与实

1、知识图谱构建流程:工业流程，长且误差传播，本体构建主观性大

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实 2、现实:数据多源异构，不单单是算法问题

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

3、现实:半结构化数据复杂多样

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实 4、现实:待处理文档复杂多变，多条技术策略轮番集成

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

5、现实:实体识别问题复杂，DIY强，标注需求量大

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

6、现实:远程监督构造数据算法在工业界很难落地

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

7、现实:实体关系抽取中的存在的诸多问题

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

8、现实:实体嵌入表示学习,准确率低，在高精度场景不适用

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

9、现实:实体对齐标准化依靠大量规则策略

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

二、大模型研发与落地的虚与实

1、现实:训练领域大模型的常规范式已知、选型量化不可知

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

2、现实:大模型研发中的数据处理流程已知、定量未知

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实 3、现实:预训练数据规模已知，但具体数据配比未知

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

4、现实:SFT微调数据自动生成的蒸馏方式已知、后期处理繁杂

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

5、现实:大模型能力评测有偏、与真实业务隔阂大

十月实践总结:粗看LLM+KG知识图谱研发和落地中的虚与实

参考文献

1、刘焕勇.《LLM+KG知识图谱研发和落地中的虚与实》,2023-10-26,北邮研究生课堂。

关于我们

老刘，刘焕勇，NLP开源爱好者与践行者，主页：https://liuhuanyong.github.io。

老刘说NLP，将定期发布语言资源、工程实践、技术总结等内容，欢迎关注。

对于想加入更优质的知识图谱、事件图谱、大模型AIGC实践、相关分享的，可关注公众号，在后台菜单栏中点击会员社区->会员入群加入。

正文完

可以使用微信扫码关注公众号（ID：xzluomor）

AI AIGC AR F1 HTML RSS Web 开源技术

发表至：智源

2023年10月31日

康奈尔医学院 – 王光煜课题组计算生物学方向博士后

特拉维夫大学 | 全局-本地培训用于生成可控制的 NeRF 场景

J. Chem. Inf. Model. | 人工智能增强多物种肝脏微粒体稳定性预测

澜舟科技荣登界面新闻“年度 REAL 创新家”人工智能赛道榜单

超越司美格鲁肽？礼来和AI药企合作，让减肥更健康

10月，19家药企裁员，涉及超8000人

评论（没有评论）

2023 年 10 月
一	二	三	四	五	六	日
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

文心AIGC

人工智能ChatGPT，AIGC指利用人工智能技术来生成内容，其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向，近几年迭代速度呈现指数级爆发，谷歌、Meta、百度等平台型巨头持续布局

文章搜索

最新评论

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

经典留声机

经典流行从来都不冲突

在这里，听见你曾经的故事

新浪微博：主播小D

小红书：小D就是我

抖音号：52915017

Search Episodes

薛之谦：从“人歌分离”到“深情解构者”的音乐涅槃之路（上）

2025年6月30日

主播小D

你一定听过这些经典合唱–第一篇

2025年1月20日

主播小D

缅怀一代歌王罗文的经典之声–第二篇

2024年12月30日

主播小D

缅怀一代歌王罗文的经典之声–第一篇

2024年12月27日

主播小D

在这里，听琼瑶，岁月长歌–第二篇

2024年12月24日

主播小D

在这里，听琼瑶，岁月长歌–第一篇

2024年12月21日

主播小D

你总能在这些歌里找到你的回忆–第一百零三篇

2024年12月18日

主播小D

你总能在这些歌里找到你的回忆–第一百零四篇

2024年12月13日

主播小D

《这些歌都发行在2001年–第三篇》

2024年12月10日

主播小D

《这些歌都发行在2001年–第二篇》

2024年12月7日

主播小D

Search Results placeholder

2023 年 10 月
一	二	三	四	五	六	日
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31