如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
林灰最终极的目标就是能够跟现行世界西方所塑造的一些规则说再见。
当林灰成长到不需要依托于西方的规则也能立身的时候甚至于是西方反而要依托于林灰所制定的规则才能立身的时候。
那林灰完全可以跟西方现行的规则说再见。
这种对不基于逻辑的“合理性”解读的控诉不止是控诉某些容易引起不公正的制度。
这种对于“合理性”的控诉图穷匕见之后归根结底还是:
——“话语权”之争。
拥有话语权相当于能够自己去解释合理性。
如此一来拥有绝对的话语权又相当于拥有了权威性。
而拥有了绝对的权威性甚至有的时候可以罔顾事实上客观规律性。
包括但不限于逻辑的合理性。
其场景大概为:“什么合理不合理,lz就是理,lz说合理那就是合理。”
涉及到权威性除了这种任性究竟有什么用呢?
当然有用,能够拥有这样的话语权以及权威性。
将使林灰搬运的速度直线拉满。
而且拥有绝对的权威性也可以使得林灰从前世所带来的信息能够收益直接最大化。
毕竟绝对的话语权意味着绝对的垄断。
当拥有绝对的权威性之后纵然林灰没想过追求市场的垄断,也能实现跟垄断差不多的效果。
就拿林灰刚刚想到的“标注数据”。
林灰在前世信息里有大量的标注数据。
涉及到机器学习的标注数据能用来换钱。
自然语言处理方面的标注数据同样能用来换钱。
但标注数据是换钱最快的吗?
当然不是。
涉及到自然语言处理方面真要说来钱最多的还得是狭义知识。
狭义知识同样是自然语言处理方面的知识来源。
应用于自然语言处理项目的知识来源主要有三大类:
——狭义知识、算法和数据。
古语云,书中自有黄金屋。
真实意义上的黄金屋虽然不尽然。
但知识能用来换钱,这个众所周知。
既然知识能够用来换钱。
那么知识来源的手段自然也能用来换钱。
甚至于知识来源手段很可能比知识本身来钱更快。
作为自然语言处理的知识来源的算法和数据能换钱。
同样作为自然语言处理知识来源的狭义知识自然一样是能够换钱的。
对于算法能换钱的基本上为世人所周知。
即便是此前不知道这个能换钱的如果长时间关注林灰前段时间的所忙碌的重点也能清楚。
此前牵扯林灰多数时间的基本都是生成式摘要算法这件事。
无利不起早,没有足够的利益驱动林灰自然不会为这件事鞍前马后。
算法能换钱这件事基本不难懂。
算法往往直接影响一些算法驱动型产品的效率。
而效率就是真金白银。
能够直接影响效率的算法自然是能够很容易换取丰厚报酬的。
理解了算法能换钱。
其实也就不难理解数据为什么能换钱。
毕竟数据是很多机器学习算法构建的基石。
机器学习算法的出现往往要依赖于有标注的数据。
而且在相当长的一段时期内机器学习算法不仅是依赖于有标注的数据。
而且是依赖于大量有标注的数据。
标注数据量较小的情况下,很多时候是不足以训练一个性能优异的机器学习算法的。
从这个角度出发,就不难理解数据为什么可以换钱。
很多时候甚至可以完全可以把数据理解为是一种隐性的知识。
而数据标注的过程实际上就是将散漫自有的离散数据结构化、标签化的过程。
在算法和数据之外,所谓的狭义知识是什么呢?
狭义知识一般指通过规则或词典等形式由人工定义的显性知识。
狭义知识主要包括三种:
——即语言知识、常识知识和世界知识。
其中,语言知识是指对语言的词法、句法或语义进行的定义或描述。
其主要特色是定义了同义词集合。每个同义词集合由具有相同意义的词组成。
常识知识是指人们基于共同经验而获得的基本知识。
世界知识包括实体、实体属性、实体之间的关系等。
或许有人不理解?
为什么这类知识能换钱呢?
这些东西不都是显而易见吗?
这些知识虽然本质上依旧是人们所能理解的显性知识。
但对人们来说显而易见的显性知识。
不等于对机器同样是显而易见的。
对于这类知识往往要通过规则化或者是词典化的处理以便于这些知识能够通过简单的处理成让机器理解。
这些很容易被机器所理解的知识叫狭义知识,也被称为专家知识。
尽管现在主要训练模型已经是谋求算法甚至是数据本身了。
但狭义知识是相当有市场的。
反正从此前和伊芙·卡莉的交流来看。
都2014了,硅谷现在开发点什么机器学习仍旧是要动不动跟哈佛、牛津之类高校合作。
这些人之所以仰仗哈佛、牛津除了是指望这些高校进行下数据标注之外。
主要应该就是指望着这些高校在狭义知识方面的加持了。
这些人这么做也容易理解。
毕竟最早涉及到自然语言处理方面的模型数据的时候人们是用狭义知识进行训练的,而不是依靠数据和算法。
甚至林灰印象中,即便是前世,在互联网迅速崛起之前,人们唯一训练自然语言处理方面模型只能是用狭义知识。
而林灰手中就拥有相当多的狭义知识,且水平什么的应该比现在西方世界所用的不知道高到哪里去了。
从硅谷为了获取狭义知识每年砸几千万美元的架势来看。
林灰手中的一些狭义知识如果能够拿来变现的话要比利用标注数据变现还方便。
但这仅仅是理论上容易变现。
林灰没有绝对的话语权以及随之而来的权威性。
林灰怎么去向潜在的受众去说其所拥有的狭义知识资料要比现在硅谷所用的普遍材料更高明呢?
其实潜在的买家林灰倒是清楚的很。
要知道就算是在往后几年对大量的狭义知识感兴趣并且又不差钱的买家其实也不是特别多。
林灰估计这个时空下可能对大规模狭义知识库感兴趣的买家无外乎是microsoft、google之类的超级巨头。
不过纵然是知道这些潜在买家,林灰也不可能去主动找对方啊。
(本章完)
本章未完,点击下一页继续阅读。