第152章 伊芙·卡莉的困惑(续)

也正是因为上述原因,无论是哪个时空。

世界上很多国家都在对文本探索。

人类社会记录方式的进步,某种程度上就集中表现在文本的不同凝练形式上。

文本的探索,对于一些大型企业来说,也是一项极为重要的工作。

涉及到文本摘要的发展,决定着一项又一项的产品的问世。

对于文本的探索,不仅仅对文学的深入研究有着很高的促进性,同样对于科技的推进有着巨大的促进作用。

总而言之,对文本摘要倾注些心血不过分。

毕竟这是林灰在技术领域方面迈出的第一步。

说到伊芙·卡莉遇到的困惑。

林灰没想到伊芙·卡莉的困惑主要集中在lh文本摘要准确度衡量模型的构建上。

林灰记得当时他关于这个模型构建已经阐述的够清楚的了。

构建模型的话首先要运用语言模型来评估算法生成语言的流畅度,然后使用相似度模型评估文本和摘要之间的语义相关性,最后为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。

虽然为了避免教会徒弟饿死师傅,林灰在这几个步骤之间故意遗漏了一些琐屑的步骤。

不过这种东西对于科研工作者来说,就像堑壕之于坦克。

虽然会有一些影响,但问题应该不大。

真的把所有的技术细节全部公布出来。

那也不能叫做公布技术路线了,那叫编教科书。

对于林灰提到的“运用语言模型来评估算法生成语言的流畅度”

伊芙·卡莉比较困惑林灰是怎么搞定语言模型训练的语料库的?

这个问题往后几年的话还真不是问题。

因为现成的语料库就一大堆。

仅仅是简体中文方面的语料库就有国家语委现代汉语语料库、京大语料库、语料库语言学在线等若干资源。

本章未完,点击下一页继续阅读。

都市言情小说相关阅读More+