上QQ阅读APP看书,第一时间看更新
1.2.3 隐私保护
人们的日常工作与生活,正越来越多地依赖信息平台的推荐,小到日常用品的选择、休闲度假目的地的选择,大到证券交易、高考志愿填报等,几乎都需要信息平台的帮助。个性化推荐系统在很大程度上依赖对用户信息(如用户浏览网页、使用在线服务、进行网络购物等行为的属性信息)的采集。采集到真实、有效的信息,对算法优化至关重要。然而,过度反馈和收集用户的信息,可能泄露用户的观点和兴趣爱好,从而造成隐私问题的产生。因此,数据隐私成为个性化资源推荐场景中的一个备受关注的问题。近年来,随着数据挖掘等相关领域的发展,有更多场景涉及敏感数据的收集和处理,带来了更严重的隐私泄露风险。
如何有效地管理隐私数据不仅是一个技术问题,还是一个社会问题和企业内部管理问题。从技术的角度出发,需要加强对隐私保护算法的研发和应用;从社会的角度出发,需要加强隐私保护意识的普及和提高,建立完善的隐私保护法律法规体系,规范企业运营和个人行为。随着大数据技术的发展,在推荐领域隐私问题变得异常突出。在推荐应用程序中,用户对指定物品的评分反映了用户的兴趣、观点、性格等。此外,推荐领域中的导航、场所查询、社交等基于位置的服务(location-based service,LBS)查询信息中不仅直接包含用户的行踪,而且隐含用户的日常行为规律信息,如家庭住址、兴趣偏好与身体状况等隐私信息,将这些信息直接泄露给不可信的第三方,会对用户隐私的安全造成严重威胁。几乎所有隐私保护方法都是以某种方式改变数据,以降低其表示的精确性(这样做是为了增强数据隐私性,其结果是让数据变得模糊,使挖掘算法不再有效)。
所以,如何运用机器学习相关原理和技术,在利用个性化推荐给用户带来便利的同时,有效保护个人信息,是一个值得研究且富有挑战性的问题。