第364章 灰色地带的利益

因为暗数据包括用户活动日志、客户对话或电子邮件记录、服务器监控日志、视频文件、物联网产生的机器和传感器信息。

暗数据还可能包括由于存储在过时设备上而无法再访问的数据。

这种情况下很多时候清理活动日志或者说收集存储碎片的时候都有可能顺手牵羊搞到一些暗数据。

除此之外还有很多种收集暗数据的方式。

说起来虽然很容易。

但正所谓抛开剂量谈毒性都是耍流氓。

同样的道理抛开数据规模谈咋挖掘数据同样是耍流氓。

像蘋淉所图规模的暗数据肯定不是传统的数据挖掘方式能满足的。

似乎时下也没太好的挖掘暗数据的方式。

传统的公司,在处理暗数据的时候,采用的是笨办法,想办法把非结构化的数据转换成结构化数据。

这种方法费时费力。

不过也仅仅只是对于时下的科技公司来说。

对于林灰来说他还是有很多数据挖掘方式的。

没人比林灰更懂如何挖掘数据了。

对于大规模的数据挖掘,似乎最方便的方式就是借助于人工智能来挖了。

甚至于林灰前世电脑里有一些现成的挖掘暗数据的方式。

虽然效率受限于时下的硬件可能会大打折扣。

但相比于现在传统的挖掘方式也是降维打击般的存在了。

不过新的问题又来了,从哪挖掘暗数据呢?

前面提到了像有些属于私有的,由政府或私人机构控制的深度数据。

这类包括由学者、政府机构和当地社区策划的数据、医疗记录、法律记录、财务信息和组织特定数据库在内的数据。

就算是属于暗数据。

借林灰十个胆子林灰也不敢去挖。

毕竟这玩意另一个名字叫国家机密。

思考了一小会,林灰倒是想到了几个主意。

但认真琢磨之下,无论是哪个主意似乎都很容易担风险,短时间内都不具有可行性。

尽管说做事情完全不担风险几乎不存在。

但为了区区两亿美元去担风险似乎没啥必要。

毕竟以林灰脑海中的信息想赚两亿美元实际上不需要太久的。

总之,完全没行险的必要。

既然没行险的必要,而且林灰一贯求稳。

那么涉及到数据挖掘为什么林灰会想出一堆有风险的方法呢?

莫非是林灰飘了不成??

再往后几年的话,林灰想到的主意没任何问题。

至少以21年年底的思维来看,林灰刚才想到的也不是什么铤而走险的办法。

林灰所想的方法完全可以合乎规矩进行操作。

但很无奈,现在是2014年,想要进行同样的操作是不可能的。

至于最直接的原因只能归因于时代的局限性。

在前世往后几年的数据挖掘一应事宜已经完成程序化、规范化。

而现在呢相应事宜却没有程序化规范化。

本章未完,点击下一页继续阅读。

都市言情小说相关阅读More+