谷歌Pixel5XL原型渲染图曝光采用后置三摄

尽管距离谷歌新一代 Pixel 5 XL 智能机的发布还有 9 个月时间,但网络上已经曝出了有关新设备的首批渲染图。 CAD 渲染展示 Pixel 5 XL 设备的外形和背部独特的摄像头模组,除了常规的主摄与长焦镜头,似乎还增加了一个超广角传感器。目前尚不清楚相机的确切规格,但可知 Pixel 5 XL 的后摄外形将与此前大有不同。

于是,她将小区业委会起诉至法院,请求撤销“一车一位”的规定,成都市青羊区人民法院受理了该起诉状,并下发了先行调解告知书。这份起诉状显示,原告为金女士,被告为成都市青羊区中鹏花园C区第四届业主委员会。

吐槽 司机停我车位还收费

数据的流动性具有合理性和必要性,而流动过程中的数据在实践中通常是被如何被归类和定位的?

用户特征值数据主要在价值挖掘中被体现,使用的方法宏观上可以分为使用原始数据和使用统计数据两类。比如某人在某时某地进行了某次购物可以被认为是原始数据,那么某人在过去的一天里进行了3次购物可以被认为是统计数据。在很多情况下避免原始数据的直接使用是不太影响价值挖掘的同时可以更好的保护原始数据的。类似的,在链条中传递用户特征数据时所使用的控制方法也比较多,常见的就有泛化(比如给定一个范围而不是具体的数值),统计(如前所述),加密(比如同态加密),差分隐私(比如给定的数值是原始数值的基础上增加一个噪音),合成(比如将原始数据转化为代表所需知识的模型或者由模型生成不同于原始数据的新数据)等等。

数据拥有者的控制力如何赋予?

停车场设有单独的楼栋,金女士的车位在第3层,与她同一楼层的车位,多以租用和购买形式设置,划分了私家车位和年租车位。

在客观现实中,数据流动存在它的合理性和必然性。一方面,对于任何一个个体,他的数据会在不同的场景中产生和被采集。比如使用打车软件会产生位置移动的信息,住酒店会产生住宿信息,在淘宝买东西会产生购物信息等,很难想象会有一个实体掌握关于这个个体的全部数据;另一方面,挖掘数据的过程也存在专业性的问题,在不同场景中根据不同需求,挖掘可能很难完全由同一个实体来完成。因此往往为了充分的挖掘数据价值,需要尽可能的将多个数据产生的源头,经过多个节点进行汇聚,加工处理和使用。

基本是将比如身份证的一部分隐去,从而在可以接近识别的前提下尽量保护数据的隐私,类似于对一般数据处理中的泛化技术。抛开脱敏过程中的信息丢失不谈,这种方法显然是缺乏足够的安全性的。因为只要存储和沉淀这样的masked data,就可以最终反推出原始数据的内容来,因此脱敏的方法在隐私要求比较高的环境中已经不再使用了。匿名指修改或者移除个人身份信息,隐藏数据和个人的对应关系。一般的数据源会自己生成并管理这种对应关系,由于个人身份信息的完全隐藏,安全性也会远高于直接对原始PII进行脱敏。同时的对于使用PII来关联数据集的这一属性,也可以靠修改内部的对应关系来组织使用匿名数据在外部进行数据集关联的操作。k-匿名在匿名的基础之上提出了个人识别不仅限于PII,任何数据形成的集合都能在一定程度上识别出一个人来,k在这里指的是用这个数据集进行识别时可以将识别的人群缩小为数量为k的集合。k-匿名是目前通用标准中较高的一类,其中k的值越高,隐私保护的效果越好,在Google和Facebook的内部数据管理中都有大量的使用。

涉及多方数据的安全运算环境的方式可以从多种角度来划分。比如从是否存在可信的第三方(或者对于该第三方的信任成本有多大)来谈,使用比如GC或者OT来实现的MPC可以实现完全没有可信第三方的环境,而基于某些同态加密设计或者可信硬件的环境一般是强依赖于对于第三方的可信度的,而可信硬件环境还存在信任硬件产品供应方这一个额外的信任成本。除了上述的两类(MPC和可信硬件)之外,也存在许多其它方式在联合运算中保护原始数据的方法,其中就有比如合成数据(比如通过将原始数据转换为模型),比如差分隐私(巧妙的选择在原始数据上面增加噪声从而在保护原始数据敏感性的前提下不会过多的干涉运算本身),还有比如传统的泛化(只传输包含原始数据的一个范围)等多种方式。在实际应用之中,一般会考虑数据的泄露危害程度(比如PII数据的泄露会造成连锁的数据泄露反应),数据是否容易被沉淀(比如高时效性的数据相对不那么容易被沉淀)等在达到安全级别的前提下,尽可能的保持信息完整性(合成,差分和泛化都会在不同程度上损失原始信息)的同时提升整体系统的运行效率。

小区停车费收取按照排气量1.3升及低于1.3升的车辆,每月每车120元,排气量高于1.3升的车辆和新能源车辆,每月每车200元,强调“小区内停车严格执行一车一位,绝不允许多车共用一个车位。”

数据在经过不同节点的过程中,会在不同的上下文环境中被提及:比如数据的收集,存储,使用,以及对应的前述行为的转让。收集主要对应原始数据的采集或者形成结构化数据的过程,比如将用户操作 App 的动作形成日志传回服务器端,或者比如将用户产生的评论进行汇总。存储和使用一般都是按字面意思对数据进行保存或者处理。为了进行数据的聚合或者借助外来力量对数据进行挖掘,可能会涉及将这些数据的存储或者使用权转让给其它方的过程。另外考虑到这些和个人数据相关的不同上下文,普通用户在签数据授权的时候也可以额外关注一下授权协议是否清晰的定义了这些不同的范畴,比如某 App 本身,对什么数据、进行不超过多长时间的存储,并且这个存储权不会转让给除某 App 本身的其它实体。

中鹏花园C区,位于成都市青羊区苏坡中路附近,有600多户业主。停车楼有单独的编号,共5层,有303个商品停车位,负一层为非机动车停车场。去年10月,金女士花了10多万元在小区购买了一个车位,车牌号绑定的是自有车辆号牌“川A×××91”,使用期限至2039年2月19日。

宏观来看,数据可以分为个人识别信息(PII)和用户特征值两类。PII是指像可以在很高精度上在公开环境下定位一个人的数据,比如像美国的SSN,国内的身份证号,邮件地址,甚至有可能是电话号码。用户特征值基本可以理解为除了PII以外其它的围绕个人行为特征或个人特性(如生物统计学数据,人口统计学数据等)的数据了。用户特征值往往是数据挖掘产生价值的对象,而PII则是扮演着将多个特征值统一在一起的角色,由PII形成的图是数据链条上公司间进行数据融合的桥梁。

记者在其提供的一份“不动产权证书”中看到,她购买的车位位于车库3层60号,权利类型为国有建设用地使用权/房屋(构筑物)所有权。她觉得“一车一位”的规定不合理。

金女士很纳闷,自己花钱买的车位为什么不能自己做主?如果包月只能包一个车牌号,却不是一个车位的使用权,那么购买车位的意义在哪里?于是,她将该小区业委会起诉至法院,请求法院撤销这一规定。

一般收集或采集到数据的一方被称为第一方数据,第一方数据为了更好的用数据服务使用者,往往会在授权中要求更多的权限。比如在数据使用权里可能会要求通过数据对个人用户的信息流进行更好的匹配,这里面可能就包含了使用原始数据(如用户对哪些帖子进行了点赞)所进行的优化,也可能包含了将一个用户的信息用于另一个或一些用户。之前提到,完全由一个实体从头到尾闭环能完成的事情非常有限,因此这里面会涉及到将用户的一些信息(可能是原始信息,可能是聚合或者泛化信息)转让给其它实体协助完成的情况。这些从第一方数据所得数据的实体被称为第二方数据。

14日下午,记者来到该小区。在门口马路边,设有40个机动车临时停车位,并按照市区四类收费标准进行收费。

在介绍工程实践的技术类型的同时,我们也希望澄清在实践中遇到的两个比较常见的认知误区:数据隐私解决方案,不等同于单一的密码学或技术点创新,是一个结合了数据科学、密码学、联邦学习、云计算的综合工程,通常是技术组合的形式;其次,对于数据隐私比较受关注的MPC(多方安全计算),最近几年,MPC在数学原理上并没有特别大的根本性变化,更多是工程方面的突破与进展。

围绕拥有方是产生数据的个体这条线去思考,在整个数据生命周期链条里面就存在对第一方数据的控制、第二三方的控制等不同的问题。对于第一方来说,由于是数据的采集者,涉及的方面也是最多的。Facebook在2018年的F8上宣布一个针对给用户控制力的功能叫Clear History,里面描述的愿景基本理解为可以允许用户在采集,存储和使用三个方面给予控制力。首先用户会看到Facebook从哪些合作方渠道获得了用户的什么样的数据(采集可见),之后允许用户决定是否可以在广告投放中进行使用(使用控制),再次允许用户对这些数据进行立即删除的操作(存储控制)。

Jon Prosser 未分享 Pixel 5 XL 正面的任何渲染,猜测其设计尚未最终敲定。不过他补充道,新机将具有类似 Pixel 4 的前额。

林小明告诉记者,尽管《管理规约》征求了大多数业主的意见并获得符合规定人数的同意后,就具有相应效力,小区业主均应当自觉遵守,但制定该《管理规约》的前提,是没有违反法律强制性规定或相应的道德规范,从前述规定可以看出,“一车一位”违反《物权法》的规定并侵害了业主的权益因而属无效。

她告诉记者,司机的车辆号牌也在小区业委会处进行过备案,按理说不应该再另行收费,可现在,业委会却说突然收费,侵害了自己的权益,“难道我的亲朋好友不能在我的位置上停车吗?”

以下是分享内容的简要提纲:

据金女士描述,在这之前,她曾采用过租车位的方式进行停车,每月两百元,后来小区停车位价格进行公示售卖之后,有人劝她买一个车位更省心一些。于是,她便按照要求购买了车位,并在去年9月取得车位所有权。

14日下午,记者也跟随金女士来到该小区业委会办公室。只有一名工作人员在场,她告诉记者,该小区属于“自治”模式,由全体业主自行服务管理,由业主委员会行使物业管理权。

除了这三方的数据以外,还存在公开数据这个范畴。公开数据的定义很难做到清晰,不过一般认为是任何一方可以通过爬虫直接从互联网获得的数据(没有经过数据拥有者的直接授权)。但在现实情况中,判断公开数据的流通是否有风险往往也和公开数据被获取的一方对于这种获取行为如何看待相关。注意这里所指的公开数据被获取方并不一定是数据的拥有者,因此也会出现在谈及数据的收集,存储,使用之外的另一个上下文:公开。即第一第二或者第三方实体是否获得了公开该数据的授权。

价值挖掘 V.S. 隐私保护 — 数据拥有者的控制力

“一车一位”侵犯业主权益

数据拥有者控制力的核心意义在于让每个拥有者在挖掘和保护之间选择自己的平衡点。为了给拥有者控制力,第一步要讨论的是谁是数据的拥有者这个问题。一般对于个人数据来说,无论是个人的身份识别信息或者生物统计信息这样对个人进行描述的数据,还是用户的行为信息(比如访问了哪些app,在app里面做了哪些事情)或者由这些行为信息所得到的新的标签这样的用户生成数据,都会认为拥有者是这个人本身。尤其对于产生的标签数据来说,有些情况下认为由于标签是比如数据采集方进行学习而得来的因此拥有者是采集方这个想法也不应该是被广泛认同的。

同时,她也提出疑问,业主是否有权出租自己的车位?一个车位是否可以轮流停放两辆车?业委会是否可以出台规定约束业主?

对于第二种(数据变现)的情况,会有比如通过特定的场景或产品进行变现以及通过售卖标签进行变现不同的类型。这里不对各种数据变现的方式进行展开,但想强调一点的是在变现的过程中需要关注的是原始数据在第二方或其它地方的沉淀情况。因为虽然一般授权方会通过限制原始数据的转让(从而保护个人隐私),但仍然会允许加工过的数据进行流通或通过某个场景达成目标。无论是哪种方式输出的结果,都难以完全地避免数据的信息被沉淀,大量的沉淀会间接的导致原始数据被转让。举一个数据泛化中沉淀结果的极端例子来说,假设我们允许对某一个人的常见活动区域输出某个较大的半径圆范围,多个这样的半径圆就可以逐步缩小对这个人活动区域的判定。

受限于数据本身商业价值或相应法律或PR风险的考虑,在这个数据转移的过程中第一方会希望尽量控制减少数据本身的泄露。一般通过协议的角度可能是规定数据使用的范畴,规定数据可以被存储的时间等。通过技术的角度可能是去除个人识别标识,做一些预处理比如泛化(将给定的位置从一个具体的位置变成处于某一个圆的范围内)等,后面会对这些方法做一个简单的描述。除第二方数据以外,还会存在一些根据某些特定目的而将大量原始数据进行汇聚的实体,目的可能是比如进行某些统计分析的研究(比如所有人的存贷比,比如所有人的年龄分布等),也可能是某些特定研究(比如某类药的安全使用范围)等,这样的实体可以被称为第三方数据。

“一车一位”是按照规定办事

综上所述我们可以看到,赋予数据的控制力长久以来都面临许多挑战。且除了第一方数据外,沿着数据链条向下走,这种挑战会逐渐增加。这种现象很大程度上源于数据作为一种抽象存在,不同于普通物品的可以被复制,而被复制的数据的控制力将会被重新的定义和赋予。因此在数据流通的过程中将数据的各种属性分开管理和授权,尽量减少数据复制的出现,可以很大程度上降低在整个链条上管理控制力的成本。需要研究的不是如何把数据的链条切段,而是如何在链条的各个环节上更好的完成数据控制力的精细化管理。

平时,由于工作原因,会由司机开着号牌为“川A1×××2”的车辆,接送金女士及其家人上班;晚上,她自己的车辆会停放在该车位。

但在部分车位上,有些上着地锁,有些则落满了灰尘。金女士告诉记者,其实很多车位因为价格过高,并没有销售出去。

雷锋网特约稿件,。详情见转载须知。

本次活动从即日起在全国展开,可采取实名投保,也可采取无记名投保,投保人年龄不限制。在保险保障有效期间,被保险人如触发保险责任均可享受7×24小时的理赔服务。

该小区的私家停车位。

而在小区走访期间,业主们也表达了对“一车一位”的看法。有部分业主称,业委会“一车一位”和另行收费规定可能存在“一刀切”的嫌疑,只为了便于自己收费,不考虑业主自身意愿;也有业主表示理解,因为存在一个车位绑定三到四辆车的情况,业委会出于安全和成本考虑,既防止有人钻空子,也便于管理。

据介绍,“中银守护抗击疫情专属保障计划”是中银三星人寿针对此次疫情推出的专属、高额保险保障计划。“中银守护抗击疫情专属保障计划”以北京、天津、浙江、江苏等12家分支机构为单位,向属地参与“新冠肺炎”的一线医务人员(含疾控人员),捐赠因交通意外身故和疾病身故双重保障。其中,若被保险人因病身故, 则提供每人最高50万元的疾病身故保障救助金;若因公遭受航空、火车、汽车及出租车等交通工具意外导致身故者,则提供每人最高100万元的保险保障救助金。

其中,一个临时停车位起价2元/1小时以内,一小时以后每小时加收1元(不足1小时按1小时计算),在同一临停位停放时间不足15分钟车辆,免收停车服务费。停放时间为白天8:00—19:00,在下午3点过,大部分车位已经停有车辆。

目前累计追踪到密切接触者16088人,2月4日已解除观察2285人,诊断为疑似52人,共有9695人正在接受医学观察。

而在中鹏社区信访办公室相关工作人员处,记者了解到,社区确实对金女士和小区业委会之间的纠纷进行过调解,但调解无果,金女士之后走法律途径起诉。

不过现在看来,该公司终于清醒了一些,并计划对今年新发布的 Pixel 5 系列智能机加以改进。

从法律关系上而言,既然业主已经合法取得其车位的所有权,那么就享有该车位的占有、使用、收益和处分的权利,因此其同意其他车辆停放,甚至出租自身车位来获取收益是其享有的权利,不应当受到其他人的干涉以及阻扰。

业委会出台《管理规约》并设置“一车一位”的规定,其初衷在于方便管理和避免因出入人员复杂而影响小区安全,但好的初衷也应当建立在合理合法的基础上,“现在,不少家庭有超过一部以上的车辆,有些业主也需要在不同时段轮流停放不同车辆。”

原本,金女士以为,自己购买了一个车位,所有权在自己手上,但到了去年12月份,小区业委会通知她,需要对司机的车辆按照120元/月的标准收取停车费,理由是《中鹏花园C区管理规约》有规定“小区内停车严格执行一车一位,绝不允许多车共用一个车位。”

渲染图还可看出 Pixel 5 XL 采用了哑光玻璃背板(类似 Pixel 4 系列),与后摄模组形成了鲜明的对比。

可以看出,对PII的控制是数据链条中形成控制的关键,没有PII的两个数据集是很难整合在一起使用的。针对PII的控制一般被称为De-identification,目前主要有比如脱敏(Data Masking),匿名(Anonymization)和k-匿名(k-anonymization)由弱到强三种比较常见的方式。脱敏

从产业的角度来看,我们常形容互联网和AI的关系是“连接产生数据,数据产生智能”,在连接和智能决策的过程,其实也是数据流动汇集、价值挖掘的过程。更丰富的数据维度和更好的数据覆盖对于模型的质量也是至关重要的。数据作为AI的原料,其流动性也是让AI更好发挥价值的基石。

中鹏花园C区大门进门处设有停车杆,进出车辆会显示收费明细。此时在小区内部划分的临停位置,已经停靠了很多车辆,有些车辆停在通道上。

数据的流动性具有其必然性和合理性,也是AI在产业中更好发挥智能的基础,但数据价值挖掘带来便利的同时,也面临着隐私侵犯的隐患。从当下实践来看,通过给予数据拥有方控制力的方式是平衡数据价值挖掘和隐私保护最有效的方式;而流动中的数据链条复杂,通常需要在数据流通的过程中将数据的各种属性分开管理和授权,尽量减少数据复制的出现,从而降低在整个链条上管理控制力的成本。数据流动过程中的隐私保护,是动态的、过程中的数据安全与隐私,对应的技术实践也将带来新的产业和创新机会。对于这个新兴的产业,早期我们所选择的方案也要迎合市场的阶段进行渐进式推广,比如数牍科技的解决方案中就设计了数据流控制,数据拥有方可以控制数据流向为单向或双向,在现实环境中灵活应用。数据隐私规范和价值挖掘是双向作用、螺旋上升的过程,只有规范数据使用才可以在汇聚更多数据的基础上迎来价值挖掘的下一个爆发点。我们很期待未来十年,在隐私规范的推动下创造出新的数据使用范式,推动AI的数据基础设施革命,并能投入其中贡献一点自己的力量。

从当下的工程实践来看,解决挖掘和隐私的两难,可能目前最好的解决方法是给数据拥有方一个控制力,包括对数据收集的授权和收集后保存和使用的控制。国际上普遍进行的实践或者规范(如GDPR)都倾向于对个人拥有的数据及其数据的各种上下文环境进行准确的授权。比如GDPR中就会要求第一方数据要明确“自己采集到了哪些数据”,当用户有了这个明目之后,应当有权来选择“保留哪些删除哪些”;在此基础之上,还比如会要求对数据处理方法作出明确问询和授权,“比如通过采集到的用户点赞的帖子的内容和类型来学习用户的兴趣爱好”;这些兴趣爱好作为标签,虽然不是原始数据,仍然需要用户进行逐一的明确授权。

截至2月4日24时,全省累计报告新型冠状病毒感染的肺炎确诊病例764例,现有重症病例38例,现有危重病例19例,累计死亡病例2例,累计治愈病例41例。其中:确诊病例中,郑州市92例(含巩义市8例,巩义核增1例)、开封市17例(含兰考县4例)、洛阳市17例、平顶山市34例(含汝州市1例)、安阳市35例(含滑县1例)、鹤壁市10例、新乡市39例(含长垣市3例)、焦作市15例、濮阳市4例、许昌市24例、漯河市24例、三门峡市7例、南阳市107例(含邓州市15例)、商丘市61例(含永城市9例)、信阳市138例(含固始县12例)、周口市56例(含鹿邑县6例)、驻马店市82例(含新蔡县7例)、济源示范区2例。

新的产业机会 — 数据流通链条中控制力管理的技术实践

1月14日,家住成都市中鹏花园C区的业主金女士向华西都市报、封面新闻反映,她就遇到了这一“困扰”。2019年10月,金女士在该小区购买了一个车位,白天,司机会来接送她和家人工作,会把车停在该车位,夜晚,则由金女士自己的车来停车,到了12月份,业委会突然通知她,司机的车辆需要按照120元/月的费用缴纳停车费。

中银三星人寿作为中国银行旗下的人寿保险服务专家,履行社会责任,持续关注疫情进展,继续以防控疫情为己任,积极响应疫情防控各项工作要求,多方关注客户出险信息,发挥专业优势,做好保险服务,为客户全力提供“高效便捷、温暖安心”的保险服务,以实际行动把的温暖和大爱送到前线,与全国人民一起共克时艰、共渡难关,携手打赢这场抗击疫情的阻击战!

业委会工作人员向记者出示的管理规约显示,小区严格执行“一车一位”。

据了解,自新型冠状病毒肺炎疫情发生以来,中银三星人寿高度重视,积极应对,第一时间成立疫情防控应急领导小组,在做好公司内部防控同时,于1月21日公司针对疫情启动重大突发事件应急预案,做好突发疫情理赔及客户服务工作,推出“疫对抗,速理赔”六项应急措施,包括24小时理赔报案服务、理赔一对一指导、理赔绿色服务通道、取消就诊医院限制、简化理赔申请手续和申请资料、实行无保单理赔等,并在1月21日通过公司官方微信向全社会公布,27日向全辖发出引导客户使用公司自助服务的倡议,确保在疫情防控期间,客户和群众的金融服务需求得到有效保障。

一个数据从生成开始的整个生命周期中,可能会在多个机构或节点间流转,在节点间进行流转的过程使得数据形成了一个网络,就像许多企业内部存在数据流动的data pipeline,在更宏观的层面也存在类似的data flow。

这个功能听上去简单,但实际上对于一个正在运转的机构来说,要涉及到鉴别所有的数据来源、在复杂的数据流里面识别各类数据、以及对某个数据的所有存储位置进行控制这几方面能力。对于小机构来说资源和投入产出比肯定是不够的,对于大机构来说由于内部数据流太过复杂,为了实现它往往会需要做整个系统的重新设计和实现,代价也不言而喻。

数据控制力管理的技术实践

当谷歌在去年推出 Pixel 4 的时候,曾宣称长焦镜头比超广角更加实用,结果错失了更大的灵活性。

数据拥有者的控制力如何赋予?

当我们通过给予数据拥有方控制力的方式去平衡数据价值挖掘和隐私保护,在实践中又会出现一个新的挑战 — 如何在不侵犯个人隐私的前提下,获得个人的授权。举个例子,比如在获得兴趣爱好标签授权的时候不太可能有用户可以预先对近乎无限多的兴趣爱好进行一一授权,一般的过程也是首先由数据挖掘方获得了某个标签,再针对这个标签进行问询。我们在过去的工作实践中见过的最好的处理方法是首先对多达三到六百万常用的兴趣爱好做知识图,将这些兴趣爱好的包含关系或者关联性整理出来;之后再对各类兴趣爱好通过找到包含关系中处于包含当前爱好的比较泛化的那类爱好进行问询这样点到为止的方式来完成。即便做到这样,虽然消耗了巨大的资源并且有很高的门槛,也很难说做到了完美,因此也就不难理解多数公司在应对GDPR或者相关合规的问题上面临着巨大的挑战这个事实。

金女士觉得,小区“一车一位”规定的不合理之处在于,自己购买了车位并取得所有权,那么就应该享有自由安排哪辆车停靠的权利,“比如我买了一个房子,我的亲戚好友要来住,等于说我进你小区这道门,我还要另外给钱?”

公开数据和前述的最大区别是,由于已经公开,只要是获得了数据拥有者对于公开的授权,那么之后不会再对公开数据的采集者进行一一授权。采集者获取公开数据的途径一般也都是通过爬虫这样的主动收集的形式,具有一定的收集和清理/整理成本。这里面一个有意思的地方在于,有一些数据并不是严格意义上的被公开数据,或者说只希望在某个特定范围内被公开。举例来说社区的运营者可能只希望社区的用户生成内容(UGC)在社区内进行公开,而不希望流传到互联网上。典型的这类意愿的表述形式有类似于Robots exclusion standard,主要用于向爬虫声明网站中哪些内容不能被读取。除此之外公开数据还有可能仅仅是可以被读取而不能希望被存储的,举例来说比如社交网站中的朋友清单。朋友清单被存储和对比之后就可以得到诸如”哪些朋友取消了对我的关注“这样的信息,这里面也存在可能侵害了别人的个人隐私的问题。一般为了防范这样的越界爬取行为,公司可能会有针对性的组织自己的反扒窃(anti-scraping)系统,在协议范畴之外对数据的控制力赋予提供保障。

据说渲染图中展示的是谷歌工程师内部正在研究三种 Pixel 5 XL 原型之一,但目前暂缺另外两种设计的渲染图。

流动链条中的数据归类

数据隐私和价值挖掘的平衡:给予数据拥有方控制力

数据流动的合理性和必然性

举例来说,为了实现Clear History:首先为了在几万PB的数据仓库中甚至更大的冷存储中找到所需要控制的数据,就需要做整个数据集的语义识别(很多时候由于表单的schema并不统一,所以直接使用metadata很难准确的判断数据类型),这个过程类似给数据打标签。为了可以覆盖更多的存储点,会需要根据已经得到的数据标签对数据流进行端到端的识别。

数据自由流动中的价值挖掘能让AI更好地发挥价值,但同时,数据流动过程中不经节制的应用,也会带来数据隐私侵犯的隐患。最近多个金融大数据公司遭到立案调查,从数据源的角度来看,其中一个重要原因就是该类公司的爬虫对触达的数据未经授权进行存储或超出了约定的使用范围。举例来说,如果有一个 App 声称帮助用户进行多个金融账户进行管理并综合呈现个人现金流等信息,为了帮助 App 呈现这些信息,用户就需要提供这些金融账户的访问权限。但如果在这个过程中 App 对个人银行账户内的所有信息都进行了抓取和存储,并将这些信息提炼出来的标签出售给第三方或利用标签开展新的业务。由于这些过程未对用户进行告知并获得许可,都是一种对数据使用权的滥用。

成都市青羊区中鹏花园“一车一位”规定引发业主质疑。

除第一方数据以外,在授权第二方的过程中,可能大体会分为两种情况:第一种授权的目的可能是协助数据挖掘,第二种授权的目的可能是协助数据变现。在第一种情况下一般会只授权使用,不授权再次转让,并且对存储进行严格的控制(控制在使用所需的存储范围内)。比如说,对消费行为进行建模的第二方数据,往往会存在过去两周和过去两个月这样两种时点,超过两个月的消费行为一般价值也微乎其微。那么在授权存储的时候一般会限定存储时间不能超过2个月(外加一个比如24小时的灰色周期)。在数据使用的授权上,一般如果对数据挖掘的目标及使用场景进行严格的限定,一方面可以保护授权方在竞争法层面的权益,另一方面也可以间接保护数据拥有方的个人隐私。从保护个人隐私的角度来讲,假设授权的目的是计算某些用户的还款风险从而帮助授权方决定是否放贷的场景,如果不限定挖掘的目的只能限于该合作方之间的征信目的,则可能会被第二方使用同样的数据用于与其它合作方的营销场景中作为对于个人现金流的判断的一个因素。

这名工作人员向记者出示了一份2019年1月印发的“中鹏花园C区第四届业主委员会换届备案资料”,其中,在第三章“物业管理”第十条规定,停车楼自有车位和私家花园内车位,每月按每车位收取管理费20元。

当所有的存储点识别完成后,为了实现功能中的实时删除,还需要在重新定义数据结构的基础上配合一个高吞吐量的中心管理系统。这个过程协调了许多内部部门,消耗了大量的资源,耗时一年以上。不难看出,在企业间的数据流通中也存在潜在的类似挑战。

走访 有人理解也有人反对

四川凡高律师事务所林小明律师认为,从《物权法》的规定来看,小区业委会制定的《管理规约》中的“小区内停车严格执行一车一位,绝不允许多车共用一个车位”存在违反法律强制性规定和侵害小区业主利益的嫌疑。业委会应当根据法律规定予以纠正,或由受侵害业主请求人民法院予以撤销。

前面提到,解决数据流通链条中赋予数据控制力的问题,主要的方式是针对不同类型的数据采取不同的方式,从宏观上减少数据使用就要复制的情况出现。那么,在具体实践里,针对个人数据的隐私保护,又有哪些宏观分类要素与技术手段呢?

谷歌将在接下来的几个月时间里敲定最终的设计,并对 Pixel 5 XL 展开后续的调整和完善。

当天下午四点过,业委会相关负责人并未在办公室,记者通过电话与其取得联系,对方告知,自己正在外面办事,“根据小区管理公约,我们是依法依规在管理小区,不是根据某一个人的意愿或者想法来管理。”

争议 业主将业委会诉诸法庭