从每个网站中筛选出用户所需要的文本作为候选语料。

而后对形成的语料库进行去噪。事实上这种方法贺天昌记得以前看过国外大学一些学报似乎记录过这方面的研究。

可国外那次失败了,因为采集到的语料库噪点太大,停用词过多,根本不堪一用。

林灰为什么会提出这种方法。

莫非林灰对去噪所用的算法一定有独到的理解。

涉及到nlp什么的其实贺天昌也不是很擅长。

但问题不大,贺天昌國内可是有些老朋友很是精于此道的。

贺天昌默默将这事记下了。

同贺天昌学术上的交流,林灰收获还是很大的。

首先就是借贺天昌林灰知道了國内在自然语言处理前沿方向的研究情况。

而國内现在在nlp方向的研究是什么状态呢?

简单的概括就是“白纸一张”

当然这里所谓的白纸一张不是说一片空白。

并不是说國内没有研究自然语言处理的,只是这些人研究的进度同国际上研究进度大致相仿。

也就是说整体上落后于前世2014的研究进度的。

在这种情况下,林灰想做学术搬运工的话似乎也是如入无人之境。

整个自然语言处理以及神经网络学习这两个方向几乎就是林灰面前的一张白纸。

等着林灰在上面书写下华丽的篇章。

不过即便如此,涉及到具体执行的时候林灰也不会大包大揽。

只需要林灰适时搞定一些关键的进展。

涉及到一些琐碎方面的进展就没必要过于贪功了。

毕竟学术方面的成果并不是一蹴而就的。

随便一个涉及到生成式摘要算法这样简单理论背后的东西也是超级麻烦。

尽管很麻烦但结果值得期许。

在通话临近结束之时。林灰又几次三番地感谢了贺天昌教授为了帮他申请一些扶持这事。

贺天昌却坚称即便将来有扶持性政策,也都是林灰应得的。

话是这么说的,贺天昌心里也是这么想的。

虽然贺天昌的研究方向涉及不到自然语言处理。

但这并不等于贺天昌对涉及到自然语言处理这个研究方向一无所知。

他山之石可以攻玉,科研中往往是有触类旁通的说法的。

很多时候适当借鉴一下别的行业的研究思路能给自己的研究方向带来启发。

因此纵然主攻方向不是自然语言处理这个方向。

但这丝毫不影响贺天昌对别的研究方向关注。

最起码对一些计算机以及计算机衍生方向取得的进展贺天昌还是很关心的。

再加上自然语言处理这个方向比较友好,并不是需要很高的门槛。

因此对自然语言处理这方面贺天昌也是涉猎一些的。

至于林灰鼓捣的东西。

因为最近对生成式摘要这个算法相关知识的恶补以及机缘巧合之下参加了一些和生成式摘要算法有关的学术会议。

现在的贺天昌对生成式摘要算法还是很了解的。

涉及到摘要的重要性自然不言而喻。

摘要的能力相当直观地这反应了人们对信息的处理能力。

在信息时代,谁对信息的处理能力越强谁就越能具有信息方面的优势。

而信息方面能够确立了优势无形中其余领域也具备了优势。

(本章完)

本章未完,点击下一页继续阅读。

都市言情小说相关阅读More+