第155章 步步紧逼的追赶者(中)

而且速度上同lin hui算法的差距还算在哈雷·普莱斯理解范畴之内。

准确度上同lin hui算法的差距才是真真正正地大到让人绝望。。

在哈雷·普莱斯他们搞得x1算法准确度上甚至都比不上连尼克那个蠢猪弄得雅虎新闻摘要里采用的算法的摘要准确度。

这让哈雷·普莱斯很是郁闷。

……

过了一会,哈雷·普莱斯突然灵光一现,对埃克莱尔·基尔卡加喊道:

“亲爱的伙计,你说问题会不会是出在lin hui搞得那个准确度衡量标准上。

应用那个准确度衡量标准的话,只有lin hui自己的算法用那个衡量标准才会获得高分……”

埃克莱尔·基尔卡加:。。。

埃克莱尔·基尔卡加:“或许你的想法有你的依据,但是我现在更建议你去睡觉……你可能有点恍惚了,究竟是什么原因让你觉得一个标准委员会审核过的标准会是一个不公平的标准呢?”

哈雷·普莱斯:“因为那个lin hui是c國人,他们什么手段都会干,我记得他们国家有的手机厂商为了宣称自己的手机强大还会专门开发一个测试软件,使用那个测试软件只有他们自己的厂商搞得手机才能获得高分。

照我看来,那个lin hui搞得那个衡量标准度的模型就是类似于这样一款测试软件……”

哈雷·普莱斯接着道:“总之,我觉得那个lh文本摘要准确度衡量模型对于我们来说非常不利。

或许我们可以参照lin hui的思路搞一个自己的衡量标准……”

埃克莱尔·基尔卡加:“你说的这个问题我倒是也设想过。

可是参照lin hui的构建标准的过程进行模型构建并不容易。

按照lin hui的思路构建类似的标准的话。

首先我们需要运用语言模型来评估算法生成语言的流畅度,然后…

如果我们按照同样的步骤进行模型构建的话。

很可能会直接卡死在语言模型的构建上。

毕竟我们的语料库实在是太逊了……

我们以前合作的麻省理工学院nlp那边给出的报告

也证实了按lin hui的思路构建语言模型不可行。”

哈雷·普莱斯:“麻省理工学院那帮人认为不可行,未必就真的不可行。

他们很有可能是他们在逃避责任而已。

反正我觉得完全可以试着借鉴lin hui的思路搞一个新的衡量标准。”

埃克莱尔·基尔卡加:“你确定我们能够按照lin hui的思路弄出一个新模型么?

你怎么保证我们弄出的模型不会跟他搞得那个一模一样?”

哈雷·普莱斯:“不管怎么说,我们也需要走这条路。

如果我们连他衡量准确度的模型都不能复现出来。

我们怎么知道他在这套模型究竟有没有猫腻?”

哈雷·普莱斯接着道:“以前我们的语料库或许很low。

但现在我们采用的语料库没什么问题。

现在是加州大学伯克利分校的自然语言中心在和我们合作。

我们测试x1验证算法时可是由10万个文本–摘要序列所组成的语料库作训练集的……”

埃克莱尔·基尔卡加反驳道:“不不不,这远远不够!

想要达到lin hui算法处理文本那种水平,我们起码需要百万级别文本-摘要序列组成的语料库做训练集。

而这还只是冰山一角。

我们还需要构建一个10^4级别带人工打分标签的文本–摘要序列作为验证集。

本章未完,点击下一页继续阅读。

都市言情小说相关阅读More+