要重构互联网的资讯架构,我们必须承认当今的互联网已充斥着带有各方利益倾向而非无私意图的垃圾资讯。通过理解资料与资讯的视角或观点,我们可以建立更广阔的资讯理解框架,藉此重构语义网的本体论。
第一人称资料是以「我是...」、「这就是我...」等方式收集的资料,属于人们主观陈述自己是什么以及如何传递资讯。然而,若缺乏信任基础,这类资讯往往毫无价值。举例来说,「我19岁时就赚了100万」这句话基本上没有任何资讯价值,因为你要么完全相信,要么认为其真实性接近于零。
不过我们不能否认,在对话中,只要事先建立了信任,或者言论建立在强有力的理性框架之上,这类自我陈述在某种程度上还是可信的。更明确地说,第一人称资料(自我陈述)是直接资讯传递的第一层,前提是已建立信任基础。
第二人称资料是以「你是...」的方式收集的资料,是对他人的直接评论。这类资料具有传递信任的特性,例如如果比尔盖茨说了关于我的好话,当有人看到这个评论时,比尔盖茨的背书会增加我的可信度。
这类第二人称资料常见于餐厅和商店的评论,人们经常参考这些资讯。但随着SEO、ASO等信用提升平台的兴起,这些评论已经无法发挥其作为第二方参考的功能,反而变成了一场信任租金的竞争。如果我们无法判断资讯是来自真实使用者还是信用提升者,这些资讯的可信度就会回到零或一的概率。
第三人称资料很有趣,它是关于某人认为你在想什么的另一层面。在分支视角的背景下,第三人称就像是你的个人AI,在你使用任何东西时记录资讯并描绘你的轮廓。为什么?首先我们必须承认,你并不是你认为的那个你。一个简单的例子是,你认为你想买某样东西,但实际上你只是被抖音的广告序列操纵了。你以理性的方式观察自己,但你必须承认,有时候(或者更多时候)你只是在自动驾驶或放松模式,你自己都不知道你的原始大脑正在被外部世界操纵。第三人称就像在监控录像中看到醉酒的自己,你可以客观地看到自己实际的行为。
自上而下的资料代表着鸟瞰视角,或称群体视角、上帝视角,从一个自由开放的角度来观察综合资料。它引入了广泛的工具来评估整体资讯,用于讲述故事、调查研究、寻找因果关係、发现关联、观察行为、衡量指标、计算统计、对相似行为的人群进行聚类、在社交网络中寻找路径、增加连通性。本质上,它是资讯理论和网络理论的核心,有助于从随机资料中发现洞见和模式。
自上而下的资料分析在互联网兴起之前就已经存在,政府主导的自上而下信号传输研究一直很普遍。然而,中间存在许多汙染资料的问题,主要问题来自意图的暴露。古德哈特定律指出:任何成为目标的度量都会变成糟糕的度量。一旦信号发出,资料就会被破坏。但如果资料本身是被动和非刻意的,那么在以下情况下就不会有问题:1. 没有人为了达到某个度量而收集资料 2. 度量暴露后的资料会有不同的权重。
这是我们争取自我资料主权和算法主权的最有力武器,同时也是几十年来我们被操纵的工具,造成资讯不对称、风险分担和权力失衡。这是重建社会信任和风险对齐的关键,可以驱逐那些靠吸血维生的寄生中间商,那些从我们承担的风险中获利的人。
众所周知,我们的所有行为都被苹果、谷歌、脸书、阿里巴巴、抖音等服务提供商监控和追踪,目的是"优化我们的体验"。我们都明白背后的真相:他们不是在优化体验,而是在最大化收益、投资回报、停留时间、转化率、用户画像,以便以更高的价格出售我们的资料。这些资料从未与我们分享,我们也无法访问,为什么?因为这是他们榨取我们的方式,是他们的垄断,他们的生产资料,他们的核心竞争力。那么,为什么我们不为自己追踪这些资料,重新掌握我们所产生和创造的资料?
这就是为什么我们应该建立客户端、私人、保护隐私、本地化、被动、AI代理驱动的资料追踪器。这是互联网的神圣权利,我们收集自己的资料,决定如何、为什么、在哪里使用我们的资料。首先我们为自己保存一份副本,然后通过隐私保护计算使这些资料可访问,从而重构我们对资料零主权的资料孤岛范式。