明悦数据科技 数据的开放与共享,你做好准备了吗

用户投稿 39 0

数据的开放与共享,你做好准备了吗?

明悦数据科技 数据的开放与共享,你做好准备了吗

1.1 数据的开放与共享

数据的开放和共享是两个完全不同的概念。数据的开放是从数据源头开放,其他人能够获得原始的数据,并对数据进行加工和处理,是毫无隐藏的开放;而数据的共享则是将数据加工之后再开放,将对方所需要的数据分享给对方。

比如,国家统计局会统计物价指数,并向全社会公布物价指数。计算物价指数所需要的原始数据则是由统计局定期从抽样数据源处得来的数据,或者通过调查得到的数据。物价员统计抽样对象的数据,然后汇报给统计局,由统计局根据各地多个物价员汇报的数据,进行加工处理,得到物价指数。物价指数包涵了各种与老百姓生活息息相关物品的价格,是一个综合指数。而物价指数的公布就是数据共享的过程,做到这一点非常容易,因为当数据发布前,物价局已经有足够的信心来发布此数据。

明悦数据科技 数据的开放与共享,你做好准备了吗

以上例子中的数据公布是数据共享的一种表现形式。国家公布相关的数据是为商业企业做参考,以此来知道经济发展走向,以避免数据不对称导致的市场失效。但数据开放则不同,在数据开放的要求下,公布物价指数的机构必须公布该数据背后的计算方法、数学模型和原始数据。通过原始数据和数学模型,其他的研究机构也能够利用原始数据重新计算得出物价指数。

数据共享非常容易得到,只要不同的组织之间有相同的使命或者商业目的就能够实现数据的共享,但数据的开放要求更高,要求从源头到最终数据,包括数学模型的全面开放。这一点所有的企业都很难做到,越是专业分工的企业,越难做到。

企业对各部门分工之后,每个职能部门都负责一部分业务或者承担一定的职能,即使你符合办事的条件,往往还需祈求这个岗位的人行方便,能够通融,快速办理。如果数据是某个部门的,其他部门在请求数据的时候,有可能该部门的人故意拖延,找各种借口设置各种障碍,导致数据分享变慢,甚至得不到最真实的数据。

这种现象在大企业会更多,在越低的职位上越明显。大企业中,每个人都担负独立的职责,拥有该职位的数据。越是低微的岗位对数据的拥有感越强烈,越想体现自己的价值,越期待被别人“请求”,这种自卑感带来的权力膨胀感会越加强烈,因此请求数据或者信息资料会越加难。

1.2 数据共享的难点在于专业分工之上的所有权之争

所有权能够带来员工的主人翁意识,带来责任感,并在发生问题之后追责到具体的人,这样就能够更好地管理公司资产和事务。很多外资企业都将公司资产或者事务赋予一个Owner(主人),这个Owner可以是人,也可以是岗位,然后让该员工或者岗位人员获得名义上的所有权,并行使有条件的支配权、使用权、控制权和处置权。虽然在本质上,该资产或者事务在法律意义上仍然归属公司。

数据也一样,当一个部门或者一个岗位采集了数据之后,就形成了天然的所有权,而这些数据又体现了他所采取的行动或者做出的决策,因此“护犊”心态就容易产生。当要求其开放这个数据的时候,一方面,他在心理上容易产生自己的“地盘”受到了侵犯的感觉,另外一方面,他也会担心自己所做的事情被别人窥探和审查。这些心理都是数据开放的阻力。

在对公司各个层面的数据进行开放的时候,必须对数据的所有权做出明确的界定,否则这种所有权心理容易导致数据开放障碍。

在推进企业大数据建设的公司中,比较中肯的或者能够保证数据持续开放的方法就是成立数据中心,让所有的数据在产生之后就归属到数据中心,个人的数据直接上传到公司的中央服务器,为全公司所拥有。

当然,这也会带来问题,最大的问题在于,所有权归属数据中心之后,基础部门将失去主人翁责任感,因为不是自己负责,所以对数据的质量、真实性、数据采集的精准度都将失去责任意识,而且容易产生一种心态—逆反心理,容易导致人为的数据质量下降。

从这个意义上来讲,一个公司成立数据中心时,其级别和汇报对象不应该太低。公司虽然是商业组织,以利益为纽带连接在一起,但仍然有权力大小和格局之分。如果级别太低,话语权不重,往往容易导致基础部门的配合力度不足,数据质量无法得到保障。如果数据部门去各个部门游说,也不会起到好的效果,需要通过赋予其更高职位和权力,才能让数据的管理更加精细,让数据的质量更高。

企业没有建立数据信息系统和有一定的自动化数据采集的能力之前,不建议成立独立的数据中心。这其中的缘由就是,当数据中心的人向每一个岗位索要数据的时候都会有延迟,甚至会获得假数据,即使企业赋予了数据中心更高的权力和更高的级别。数据所有权的转移会面临很大的阻力,并且这个数据所有权争夺战会天天在办公室中发生。但如果有了信息系统,职能部门就必须把数据按照要求的时间节点录入系统,数据在录入之前是个人的,但在录入系统之后就是数据中心的或者说是公司的,从而避免了关于数据所有权的“征战”。为什么需要自动化的数据采集呢?如果没有自动化的数据采集设备,那么数据将需要手工录入,则必然会带来人为的误差,而利用自动化的数据采集设备得到的数据的准确性能够得到保证。

1.3 数据开放下的权力格局变革

数据即权力,拥有数据即拥有权力。如果数据开放了,权力格局必然会发生变化。之前很多岗位靠拥有数据从而拥有了权力,但随着数据的开放,岗位的职责回归做事本质,每个岗位的价值点将会发生变化,但原先并不具有权力职能的部门,随着拥有数据的多少而使权力得到了重新分配。

门卫因为有守卫职责,所以在数据没有开放之前,门卫要尽审查职责,拥有对进出公司的人员进行检查的权利,当数据开放之后,通过进出预约系统,只需要根据预约系统确认即可放行,这样门卫的权力就被削弱了。很多公司的门卫、秘书等工作人员在数据没有开放和共享之前,往往拥有很多了解其他信息的形式上的权力,

因此会掌握很多的内部消息,从而成为一个公司消息传播的重要通道。而在数据开放和共享之后,其权力就被削弱了。

数据开放之后,所有的数据在数据中心集中,然后再开放给相关的岗位和人员。因为数据中心拥有了更多的数据,从而无形中被赋予了更多的权力。有些人为了获取到自己岗位不应该获取到的信息,想方设法跟数据中心的人员搞好关系,通过请客吃饭、送礼甚至贿赂来获取相关的信息。而有些不法的竞争对手为了获取商业机密,不惜花重金从数据中心相关人员手中购买数据,如果相关人员意志力不够坚定,品行不够正直,则很容易被贿赂和收买。

以上这些都是在数据开放和共享之后可能发生的变化,所以企业在对岗位人员任职资格进行审查时一定要严格。

比如,对于数据中心的数据库管理员(DBA)的任职资格要求就不仅仅要要求其熟练掌握DBA知识和技能,对其数据分析、数据挖掘、数据应用方面的能力也要具备,同时也要求DBA更加深入理解公司的业务。另外,个人品行的好坏也变得更加重要,因为其所能够接触的数据增加了他的权力,拥有高尚的职业操守才能保证其不会做损害公司利益的事情。

全文摘自《企业数据化管理变革-数据治理与统筹方案》赵兴峰著

该文转载已取得作者认可

版权说明:版权所有归明悦数据所有,如需转载请联系我们,我们将在第一时间处理,或请注明内容出处(《企业数据化管理变革》赵兴峰著),非常感谢!【往期内容已在(明悦数据)公众号同步发布】

下期内容更实战!

数据安全与隐私保护

明悦数据科技 数据的开放与共享,你做好准备了吗

数据安全自古有之,并不是一个全新的概念。冷兵器时代的战争就非常关注情报,通过情报可以了解竞争对手的强项和弱项,从而制定制敌的方法和手段。而数据保护就是针对这个情报采取的保护措施,确保自身的情报不被泄漏。但随着数据技术的发展,保密工作越来越难,数据安全包括个人隐私问题也是一个非常具有争议的话题。

1.1 数据安全是相对的

随着社交媒体的发展,我们在充分利用社交媒体带来的便利的同时,也在无时无刻泄漏着个人的秘密。当我们使用微博发送一条消息的时候,即使不标记自己的地理位置,别人也能通过你所发的内容定位你在什么地方。你在微博上发了一张照片,而照片背后的信息就会泄漏你的个人信息,因为每张照片都有EXIF信息1记录,当你在网上发布照片时,该信息已经被同步发送了,别人下载照片之后就可以轻易地用软件读取到所有EXIF信息,并根据该信息了解照片发布者的相关情况。当你把在家里拍摄的照片上传到网上的时候,看到照片的人就非常容易地定位你家的位置;当你把在宾馆拍摄照片上传到网上的时候,别人就能够知道你现在住在哪家宾馆。这些信息并不是保密的,而个人也是无意上传的。有些网站比较重视保护个人隐私,会自动删除上传照片的EXIF信息,大数网站只会对照片进行压缩处理,这就容易导致个人信息泄露。只要使用社交媒体,必然会带来个人信息的暴露,这是使用社交媒体的便利所付出的代价。

现在很多网站都在使用Cookies来获取用户浏览网站的记录,从而分析个人的偏好,以便定向推送用户可能需要的信息。当用户使用百度搜索了一些关键词之后,该搜索记录将被浏览器记录,并在用户下次登录网站时推送与被搜索过的关键词有关的广告。比如,你使用百度搜索了汽车的品牌,当关闭了浏览器之后再次登录时,网页周边的广告就全是与刚才的搜索非常相关的内容。浏览器记录了你每次搜索的行为,然后当你再次使用该浏览器访问网页的时候,针对搜索过的内容提供对应的广告,这样的广告对你来说相关程度就非常高。

数据安全领域的所有权仍然是一个有争议的话题。比如,我们在各种社交媒体平台上传的个人信息,该数据的所有权是属于用户还是这些互联网公司的?如果是属于用户的,那么互联网公司有没有资格使用这些数据?如果是属于互联网公司的,那么互联网公司在使用这些数据时需要注意什么问题?互联网公司在什么样的情况下可以使用?在什么样的情况下需要征得用户同意才可以使用?个人信息所有权的问题在国内还缺少科学合理的立法保障,同时对互联网公司使用个人数据也缺少相关的检查机构的监管。这个争议在世界范围内都是难题,哪怕在互联网发展相对成熟的美国都存在公司未经用户同意随意采集和使用个人数据的情况,只有在发生了不良影响的时候,才通过诉讼程序来解决这一争论。这在全球范围内都是一个难以解决的问题。

现在有各种软件公司通过开发软件来获取用户的个人信息数据,特别是一些投票网站、购物网站、金融投资网站等,通过补贴现金的方式来吸引用户注册,从而收集个人信息,形成用户数据库。而有些快递公司的管理不到位,可能出现快递员拍照个人送货单上的地址留存客户信息,然后出售给第三方机构的行为,这种做法已经严重违反了个人信息安全方面的法规,所以需要有更加严格的监管方案出台。

着眼于企业的情况,企业所拥有的员工个人信息的所有权的归属问题也是值得探讨的。员工为企业工作,企业收集其个人信息以便为其安排工作岗位,并更好地服务员工,这看上去并没有不合理的地方。但这些信息收集上来之后,所有权归谁所有?是否还是属于个人的?企业在采集员工个人信息的时候是否需要做出重要的声明,告诉员工这些信息将用来做什么?这种承诺符合法律规定吗?企业是否会用这些信息做出对员工不利的决策或者行为?谁来监督?现在大家的个人信息安全意识普遍还不太高,但随着互联网的发展,大数据的不断被使用,人们的信息安全意识应该会逐步提高,获取数据的成本将会大幅度增加,因此对数据的使用范围和使用方法的监管将变得越来越严格。

当然,数据安全永远是一个相对的命题。京东、天猫等互联网电商巨头后台有着丰富的个人信息数据,这些数据用来研究消费者的喜好,从而在推送广告时能够更加精准,消费者所看到的广告就会更加符合个人需求,对广告的厌烦程度就会下降,互联网使用体验也会得到提高。虽然互联网电商巨头未经个人同意使用了用户个人信息数据,但并未对用户造成坏的影响,同时提高了用户的互联网使用体验。这在一定意义上来说是良性的,不仅仅对用户,也对社会资源的配置优化起到积极的作用,减少了社会资源的浪费。

1.2 数据安全管理靠机制

数据安全问题将会是未来长期困扰着大数据行业的话题,而且围绕数据所有权的争论也将持续。为了更好地保护数据安全,使数据不被非法分子所利用从而对个人安全、公司安全和社会安全造成威胁,国家需要制定相关的法律法规去约束。虽然法律法规的约束机制在事前有一定的震慑作用,但多数情况下靠法律来解决的安全问题都是事后惩罚式解决方案。如果公司的数据安全靠法律来解决,基本上已经晚了。企业要解决数据安全的管理问题,需要制定相应的机制,最好有过程中的报警机制,并在招聘管理、人员管理、控制方法、自动化预警机制、流程制度上制定相应的方案,才能更好地保障公司的数据安全,一旦出现问题不用通过法律途径来解决。这就是数据安全的机制设置。

在招聘管理上,重视能力的同时也要对个人的品行进行考察。品行端正的人做违法犯罪事情的概率会大幅度降低。

在人员管理方面,根据每个人的岗位职责规定相应的数据访问权限,可以在公司电脑中安装相关的监控软件,监控电脑的使用,对电脑使用的日志进行跟踪,并保留到公司的服务器端,特别是对敏感数据的处理更加需要软件的监控,以防止数据被非法外传或者非法使用。当然,对于高手来讲,任何的监控软件都有方法进行破解。但对于一般意义上的防范,对于减少数据泄密的可能性还是非常有效的。特别是数据部门的软件监控,即使软件被破解或者被特殊的方法终止,仍然有软件使用的日志可以查看。监控软件能够起到看门锁的作用,软件越复杂,相当于安装的锁具越高级,对开锁技能的要求也会越高,从而对数据的保护将更加有效。目前好多公司的电脑都安装有多个监控软件,通过多道锁的保护,减少数据被非授权传播的几率,即使公司的电脑丢失了,也有一定的保障作用。

在服务器端也应该设定一定的自动化预警机制,除了对日志进行保留,对敏感数据加强管理外,还要对数据访问进行预警。当有人访问了公司的敏感数据之后,达到一定的量级,则要预警通知给相关人员。比如,人力资源部的经理是有权限访问公司员工个人信息数据的,当这个数据以单条或者小组的方式被查询的时候,系统可以默认为是允许的操作,当一个业务单元的人力资源经理的账户要对全公司所有人员的信息进行查询操作的时候,就需要预警给相关人员,包括系统自动通知邮件、短消息等方式。如果人力资源部的经理对该数据的访问得到过授权,那么被通知的相关人员应该知道他有这个访问的需要,而当该经理没有得到授权就进行全员的数据访问,则有可能是非法的查询,这个时候就需要采取相关的措施了。

数据分级制度。企业在建立了完善的数据地图之后,需要对公司内部数据分级进行安全管理。一般来讲企业的数据可以分成绝密、机密、保密、公司内部分享、公开数据等几个级别,不同公司可以根据公司的内部数据分级情况进行管理。绝密级别的数据一般仅限少数人能够访问,比如公司的产品技术数据、客户报价数据、采购报价数据等;机密数据是仅限公司部分级别人员或者职能部门可以访问的数据,比如薪酬数据、个人信息数据、公司财务数据和订单数据等;而保密数据是在授权情况下可以由公司内部管理者访问的数据,该类数据比机密数据等级较低,可以在较大范围内共享,但又不能给全员分享,比如公司的薪酬体系等;公司内部分享数据,为公司所有内部人员所用,公司所有的正式员工都可以访问,但又不可以对外公开的数据;而公司公开数据则是公司为对外宣传所对外公布的数据,比如上市公司的财务报表、公司广告、软文、宣传资料等。从保密等级上划分,形成了绝密→机密→保密→内部→公开5个等级。公司内部管理上,针对每类数据的开放范围要制定

清晰明确的标准,并在数据系统和数据库上建立相关的授权机制,从而对数据形成严格的分级管理机制。

保密等级的时间效用性。一般情况下,数据的保密等级会随着时间的变化而变化,比如绝密文件在有效期过后会转为机密文件,而机密文件在过了有效期之后会转为保密文件。公司制定了股权分配机制,在该机制还未确定和发布之前属于绝密文件,而一旦发布则变成了机密文件;相关的政策性文件则是保密文件。所以,公司在对数据进行保密级别划分时,往往需要对数据的保密等级设定相关的有效期,并设定有效期结束后应转为什么样的保密等级。

授权流程。对数据的授权流程控制是非常重要的。当一个员工需要对一定的数据进行分析的时候,如果该数据超出了自己的访问权限,则需要高层进行授权,然后由其在授权范围内访问,当项目结束或者工作完成之后,该授权自动结束,其所访问的数据需要收回,并对电脑使用记录进行无法恢复的删除。很多公司在授权上都能够做到,但在使用完成后的删除管理上却难以做到,导致很多员工离开公司之后,会带走其曾经访问过的数据。虽然威胁不大,但是这些数据却是竞争对手或者竞争情报机构热衷采集的数据。如果员工责任心不强或者经受不住诱惑,会导致大量的数据流失情况的发生。

保密规定。员工在入职后一般都需要签署保密协定,保证其在职期间保守公司秘密,并在离职后继续对公司的信息保密。西方国家法律相对较为健全,虽然员工离职后对在职期间的数据有留存,但对数据的保密则会坚守自己的职业操守。但在国内,由于信誉机制不健全,员工的职业操守相对要弱一些,往往会发生数据泄漏的情况。

排他协议。有些公司会与员工签署排他协议,即离开公司后多少时间内不能到指定的竞争对手公司工作。这种排他协议成本较高,因为根据劳动合同法,在员工离职后,公司需要在保密期内为员工支付一定的工资来确保该协议的有效性。

1.3 盗不走的只有经验

数据安全永远是相对的,只要数据还需要人们的访问和使用,数据的安全就存在人为的威胁,绝对保密的数据反而没有价值。企业要想让数据发挥更大的价值,就需要将数据放在更大的范围内共享,因此其泄密的风险就会大大增加。数据的泄漏风险等级会随着开放人数的增加成幂级增长。

数据是可以泄漏的,但数据背后的价值以及企业使用过程中积累的经验是无法被盗走的。企业积累了数据首先会考虑如何更好地利用,此时会通过内部的数据开放和共享来解决数据使用的问题。如果担心数据泄漏而拒绝开放数据,让数据在服务器的硬盘里“睡觉”,那么企业将永远无法获得数据价值,反而让数据等待着被盗走。而当企业使用数据做出了相关的经营和管理决策后,即使数据被非法泄漏,价值还是体现了。换句话说,当我们往前看的时候,历史的数据反而不再那么重要了。企业应充分利用现有数据努力往前跑,那么留下的只是历史的脚印,而且企业跑得越快,留下的历史数据越加不那么重要。所以,不用担心数据因为开放或者分享而有泄露的风险,反而要通过数据开放和分享,发挥数据的最大价值,让数据挖掘为企业带来更多的收益,从而提高企业的经营和管理水平。若死守着数据不分享,则什么价值也无法获得。

以上的结论对部门来说也同样适用。部门的数据也需要开放给其他的部门,以发挥数据的价值,死守着本部门的数据,不充分地利用,肯定对本部门没有什么意义,对其他部门也没有什么意义。一个部门的数据如果不同其他部门的数据结合起来解读、分析和挖掘,也是没有意义的。数据割裂和信息孤岛都不利于数据的深度分析和解读,只有开放、分享和相互关联起来才会有价值。有些部门经理总担心自己的数据分析能力不如其他部门,数据开放反而是给其他善于利用数据的部门所用,因此拒绝开放数据。这种狭隘的想法是不会帮助其学会如何利用数据的,因为在同其他部门协作分析数据的时候,可以向其他部门学习,封闭的思想不会让自己学会分析数据,而只有通过开放和学习,才能让自己成长。

当然,数据应用的经验是需要积累的,而很多的数学模型在构建之后需要长期的应用,并不断修订模型参数和误差,才能更加精准,这就是一个积累的过程,如果不注重积累,得到的结论就会有失偏颇。所以企业不需要过度担心数据安全问题,只要在数据应用上不断研究、积累经验、无限迭代,一定会享受到数据开放和分享带来的好处。

全文摘自《企业数据化管理变革-数据治理与统筹方案》赵兴峰著

该文转载已取得作者认可

版权说明:版权所有归明悦数据所有,如需转载请联系我们,我们将在第一时间处理,或请注明内容出处(《企业数据化管理变革》赵兴峰著),非常感谢!【往期内容已在(明悦数据)公众号同步发布】

下期内容更实战!

相关问答

抱歉,评论功能暂时关闭!