24小时联系电话:185 8888 888

要闻
您现在的位置:首页 > 要闻 > Canopy为以隐私为重点的内容推荐提供了蓝图

要闻

Canopy为以隐私为重点的内容推荐提供了蓝图

发布时间:2019/09/20 要闻 浏览次数:31

 

随着云计算,电子商务和社交媒体的出现,很难密切关注谁可以访问我们的数据,并且更难以了解他们对此采取了多少关注。事实上,在没有某种形式的数据泄露,失效或隐私丑闻出现的情况下,仅仅过了一天。但“数据滥用”构成了广泛的场景,远远超出了不良的安全卫生。

在线跟踪和分析很普遍 – 事实证明,通过了解您的位置,您的工作以及您喜欢的内容,可以赚取大量资金。这一切都归结为根据你是谁来销售产品 – 从产品到播放列表再到政治意识形态。 Facebook和剑桥分析丑闻强调了如何利用庞大的个人数据库来构建社交网络,以便对选民进行评论,并通过个性化的政治广告对其进行微观定位,这是数据隐私和滥用问题的分水岭。

但个性化仍然渗透到数字领域,从视频和音乐流媒体服务到网络搜索和电子商务应用。公司真空吸尘大量的行为数据,例如查看的页面,点击的链接,观看的视频和收听的歌曲,并经常将其与其他数据(如位置,电子邮件地址和人口统计信息)相结合,以创建一种虚拟模型一个人在云端。这一切都是为了“了解”你并预测你可能会喜欢什么,无论你是否想要这些公司。

在这种背景下,Canopy正在一个适合以隐私为重点的工具的市场中占据一席之地。这家总部位于纽约的公司创建了所谓的“私人内容推荐系统”,它不会在远程服务器和用户设备之间来回发送个人数据 – 所有数据处理和机器学习都在设备上进行本身。

Canopy由首席执行官Brian Whitman于2017年创立,他是音乐情报公司The Echo Nest的前联合创始人兼首席技术官(CTO),他于2014年出售给Spotify,通过数据挖掘,机器学习的组合为后者的音乐推荐算法提供支持。和其他机制中的信号处理。正如他当时宣布的那样,惠特曼于2016年离开Spotify,参与“个人项目并在2017年开始新事物”。

为展示其新技术,Canopy今天推出了其首款产品–Tonic–一款仅限iPhone的应用程序,该应用程序使用设备上的机器学习和差异隐私来建议来自互联网的长篇阅读。

从一开始,Tonic就是让用户知道它不需要任何信息。 “我们的编辑使用定制的机器学习工具来定制互联网隐藏的宝石,”它宣称,用户甚至不必登录或创建帐户。

“我们正试图建立一个更加私密和道德的互联网,”它继续说道。

与类似的内容推荐系统一样,Tonic首先要求用户从网络上的一系列专题文章中进行选择,建议他们至少选择五篇左右来推动这项活动。

在应用程序内部,用户可以阅读他们刚刚添加的所有文章。个性化建议在随后几天通过基于Tonic认为用户喜欢的每日剂量的文章开始。用户还可以通过长按其活动流中的文章然后滑动一个小控制器以指示他们对特定文章的喜爱程度来指导此过程。

当用户点击阅读文章时,他们会被带到原始出版物的网站,该网站可通过应用内浏览器访问,该浏览器实际上是拒绝所有Cookie的隐身窗口。

Canopy的核心是更有兴趣了解您喜欢阅读的内容类型,而不是了解您作为一个人。在引擎盖下,它的推荐引擎发现了人们正在全面阅读的相似之处,并提出了其他可能不会立即明显的建议。距离Spotify的个性化发现每周播放列表的工作方式并不是一百万英里。

Canopy使用所谓的差异隐私,它限制只访问来自更广泛用户群的聚合信息。差异隐私本质上使组织能够从群体的模式中学习,而不区分群体中的个体。因此,Tonic不会存储IP地址或设备ID。虽然内容推荐系统通常仅在数据到达其服务器后聚合数据,但Canopy不希望所有数据都以此开头。

“这对我们的方法来说是一个至关重要的区别,”惠特曼在一篇合着的博客文章中写道,该帖子在今年早些时候解释了这项技术。 “即使在加密失败的最坏情况下,或者我们的服务器被黑客攻击,也没有人能够对私人模型做任何事情,因为他们不代表任何个人。”

然而,这种方法有一个缺点。如果用户购买新手机或想要在另一台设备上访问Tonic,他们将需要从头开始 – 没有办法将他们的建议移植到其他地方。

领导更广泛的Canopy产品开发的是Matthew Ogle,他最近从Instagram加入公司,担任产品经理。他曾担任早期音乐流媒体先驱Last.fm的网络产品负责人,之后加入The Echo Nest和后来的Spotify,在那里他为Discover Weekly指导产品开发。因此,他对定制的建议了解了一两件事。

根据Ogle的说法,Canopy使用机器学习和人类来定制其内容推荐引擎。由前纽约时报社区编辑Bassey Etim领导的一个编辑团队与工程师协同工作,策划自动化建议 – 这一切都是为了确保人类在将其传递给Tonic之前已经将所有内容都看了一眼。 “在[编辑]与机器学习 – 集群,逻辑 – 正在进行之间存在持续的反馈循环,”奥格尔在接受采访时告诉VentureBeat。

以这种方式工作的主要原因,不是将所有东西都交给机器,而是与回声室有关。

“我们不想使用整个互联网并使用机器学习过滤它,”奥格尔继续道。 “我们认为我们知道这方面的缺点以及导致的方向。在我们的研究过程中,我们听到了很多东西[是]每个人都喜欢个性化,但并不喜欢将它们归类。“

最终,这一切都是为了确保质量和多样性。

“最好的个性化产品应保留给你带来惊喜的权利,并为你提供真正在你驾驶室内的东西,”奥格尔补充道。

Canopy去年筹集了450万美元的小额资金,并没有表明它是否计划将Tonic或其后推出的任何类似应用程序货币化。看起来,长期目标是将底层架构授权给第三方开发人员,这些开发人员可以将隐私设计到他们自己的应用程序中,并将自己作为Facebook及其同类企业的对手。

“[Tonic]是一个试验技术的游乐场,”Canopy的产品战略主管和前Spotify高管Annika Goldman向VentureBeat解释道。 “我们真正了解未来的互联网生态系统会是什么样子。我们目前还在与其他公司进行对话,讨论如何向他们授权基础私有个性化技术。“

虽然Tonic在很多方面都是旨在突出其基础技术的概念证明,但该公司很快指出,它看到了“Canopy-powered技术和Canopy拥有的体验”的未来,正如Ogle所说的那样。

换句话说,即使与第三方签订协议,我们也可以期待Tonic在未来获得更多的花里胡哨。

尽管有一些误导性声称没有任何有意义的消费者对大型科技公司的强烈抵制,但像Facebook和剑桥分析公司这样的高调丑闻 – 以及无数其他丑闻 – 只是增强了一种越来越强烈的感觉,即公司跟踪我们的每一次数字化行动都不是一件好事。

惠特曼告诉VentureBeat说:“消费者正在意识到你不必交换你的数字身份以获得良好的在线体验。” “直到最近,大平台还没有任何替代品,但现在有一些小型科技公司在没有利用他们的数据的情况下为人们提供了惊人的体验。”

在过去二十年的大部分时间里,惠特曼一直参与某种形式的音乐推荐工作,但是在The Echo Nest和后来的Spotify中,他敏锐地意识到算法和个性化如何影响用户隐私。 “我现在特别反思预测,隐私,信息检索和机器学习对我们文化的作用,”他当时说。

Spotify并没有完全陷入谷歌,Facebook和亚马逊等同类数据隐私丑闻,但该公司拥有大量与用户的收听习惯相关的个人和情感数据,它可以甚至根据某人的心情定位广告。最近,Spotify还开始要求用户的GPS数据验证用户的家庭计划。因此,虽然Spotify在隐私领域被视为一个相对优秀的演员,但隐私崩溃的成分可以说是恰当的。

几年前在SpotureBeat会议上发言时,Spotify执行官Brian Benedik同意该公司收集了“关于人们正在倾听的内容,地点和背景的大量数据。”“它确实让我们深入了解这些人是什么做,“他补充说。

在Facebook和剑桥Analytica事件发生之前,大多数人可能都知道他们自愿提供给Facebook的数据,例如当他们“喜欢”公司的页面或更新他们的关系状态时,可以用于广告。但大多数用户可能都不知道Facebook也可以追踪他们的Facebook外活动,因为任何整合了Facebook技术的网站(如Like按钮)都会进入社交媒体巨头庞大的网络跟踪操作。在剑桥Analytica之后,人们真正开始关注正在发生的事情,即使他们没有立即改变他们使用网络的方式。

更广泛地说,人们越来越意识到网络如何运作使得数据隐私主题成为政府,公司和至少一些消费者的首选。去年推出的欧洲通用数据保护条例(GDPR)迫使企业重新考虑其数据收集实践或面临巨大的处罚。反过来,这为资金充足的初创公司利用刚刚起步的隐私工具行业开辟了大量机会。与此同时,像Firefox创建者Mozilla这样的科技公司也在努力使自己与“隐私”保持一致,而不是“隐私泄露”。

所有这些都表明,对隐私意识软件的需求可能在未来几年内爆发。

“我们看到越来越多的监管 – GDPR只是一个开始 – 我们看到越来越多的技术审查,”高曼说。 “所以很多公司都在说,’我想要领先于此,我想投资技术,让我能够做我想做的所有令人惊奇的事情,但保持数据的私密性和安全性。’”

姓 名:
邮箱
留 言: