2019-07-22 17:44:31 来源:经济观察网
算法和信用,都是眼下热词。如何看待现代社会中算法逐渐占据要害,以及如何从伦理等角度看待算法,针对相应题目的论说可谓日新月异。建设征信体系,打造信用社会,都是当下声势正盛的方向。当二者“强强联合”,未来的可能图景,将因此颇为“两极化”。乐观者称,藉先进算法运转的信用体系,既能引导个体向善,又是经济引擎的最佳“润滑剂”;悲观者则忧心相应算法不够公正,或不够透明,甚或彻底沦为监控的手段。
这些问题不新,实际上都是“老相识”。在2017年出版的著作《予以贷款:美国消费者监视和金融身份史》(Creditworthy:AHistoryofConsumerSurveillanceandFinancialIdentityinAmerica)中,作者JoshLauer做了两件前人未竟的事。首先,大致以编年形式,系统地梳理了美国征信机构的历史。起点惊人的早,针对商人的征信机构历史最早可追溯至180年前,纳入普通人的征信机构也有约120年历史。
其次,作者向我们展示了一些极具趣味的发现。伴随征信发展,一些特定的“母题”反复现诸不同年代。本文接下来的部分,就将重点谈论其中四个历时悠久、又极具当代意义的典例:批评“冷冰冰”的数字无法全面衡量人心,是其一;征信机构本身是否“守正持中”,是其一;“科学”的征信对特定群体的歧视,是其一;相应机构广采、深搜个人信息对隐私与自主的破坏,又是其一。
当人性“沦落”数字
人人相熟的社会中,征信着实没有什么市场,数十年如一日地打交道,本身即是难以替代的信用凭证,个人既熟知对方品行,又无惧对方逋逃。不过,19世纪初以来,伴随美国多地城市化与移民现象的繁盛,上述格局逐渐崩解。流光溢彩的都市里,个体与陌生人做生意的机会愈来愈多。交易对手,之前素昧平生,转眼相望江湖。对征信服务的需求,便由此分外迫切。
1843年,出于“确定借贷者是否有能力偿还借款,以及具体该出借给借贷者多少款项”的目的,Tappan(人名)设立商业局,向商人、店户、银行、保险公司等商业实体提供征信服务。同类机构很快扩张至全国。Tappan的商业局主要出售两类信息:一是借款人有没有足够的财产,二是借款人的禀性如何,是否“有能耐、靠得住且机敏”。之后,此类机构所提供的借贷人信息又被进一步归约为三类:品性,能耐和资本。
将品性作为重中之重,是当时征信的特色。与今日“数据驱动”的经营模式不同,当时的征信机构颇有几分“原始”:他们写信布置各地的线人,要求他们搜集当地生意人的信息,一一发回总部。往返传递的信息中,个人品性占了大头:此人是否勤劳?是否认真履行职责?当地乡人对此人风评如何?此人是否受当地人信任?是否已婚是否酗酒是否赌博是否慷慨慈善?一个人的信用大半是此类针对个人性情的评价。
时人总结征信机构的职能:记录个体在本地的声誉,再供全国各地查阅。从这个意义上看,“鸡犬相闻”的乡土声誉与“案牍森严”的城市征信,彼此间更多呈现接续,而非断裂。这一导向,也深切影响了征信业在20世纪中期前的发展。其时,全美大部分地域已然城市化,人口普查则让调查表、统计术及计数机器不再陌生。尽管如此,相当一段时间内,信用的核心仍是人。
关键人物是信用审批经理人。他们的锋芒已然消散,然而在20世纪中叶前的美国,他们是颇令普通市民忧惧的一类人。据原书引用的多处描写,凡需审批信用的场合,经理人“面无喜乐”而又“深邃如电”的面谈,都让普通人有种“自己被看透”的感觉。哪怕财产等条件已然达标,对个体秉性的怀疑,足以令审批经理人“一言置之死地”。20世纪60年代以来,海量数据逐渐“浸灌”行业,人在信用中的权威才开始一点点淡出,过程当然不是一帆风顺。
当中立化为往事
如果说注重品行像是老派绅士的作风,在“保持中立”方面,征信机构的作风同样“古板”。何谓“保持中立”?之一,“不偏不倚”。个体如何行事,机构就如何记录,机构如何记录,后续就如何评估。征信机构,不过在个体与购买记录者间的渠道。之二,“恪守本分”。诚然,征信机构有许多宝贵数据,也因此熟悉许多个体、许多企业。然而,机构只做信用,不会凭倚优势,逾越行业分界。
征信与营销间的“泾渭分明”,是以上说法的最佳注脚。20世纪中叶前,由报纸、至电话、而电视,鼓动民众“买买买”这项生意,以前所未有之势扩张。营销对数据的渴求没有止境。积攒海量个体数据的征信机构,自然成为营销者的大主顾。不过,如当时行业格言所示:我们(征信机构)只负责为个体拍“X光”,而不负责“X光片”的“诊断”。
征信者始终没有涉足厚利的营销业。“缺乏对营销的了解”,这一点并没有说服力。实际上,征信业者非常清楚此类买家的需求。为此,他们拣选最具针对性的数据,并以便于处理的方式打包出售。不仅如此,长久合作之下,行业已擅于妥帖处理各行各业的需求:零售业者、银行风控、政府机关……各自拿到的,都是最适合自身用途的信息。从现有证据看,对自身信誉的保守,对合作伙伴关系的珍视,以及保守态度下对新业务成本的畏惧,都是更为合理的解释。
持续百余年的操守,在20世纪60年代间逐渐走到尽头。先以合作形式,再至亲自“下场”,征信机构开始针对社区迁入者开展营销。经历乔迁,新来者常有多方面的购置需求,趁热打铁的转化率自然令人满意。在把握相应营销时机方面,准确掌握众多个体住址及购买力信息的信用机构,颇有优势。很快,从业者便有如下说法:“我们保护借款者免遭损失,但现在,我们的主业是营销”。“数据为王”趋势下,类似勾联逐渐向其他行业蔓延。初始阶段,信用机构对借贷实务的介入不甚深刻,汇集资料抄在纸上装入档案,逢有银行或保险企业来临,取出上述材料,开示或抄录一份。然而,随着信用业对数据的挖掘日益深入,信用机构与客户间的纠缠愈加复杂。如今的信用机构不仅拍摄“X光”,还出具诊断结果,甚至给出应对措施。
占有数据者雄踞数字经济的制高点。从制高点向四野“征战”的过程,注定引致无数争议。向营销等行业“进军”的信用业,频繁面对“失却中立”“利益冲突”等批评;同理,手握以亿计个人数据、并由此向其他市场传导势力的几家巨头,同样面临着各方的严厉批评,甚或遭遇调查指控。脸书与亚马逊的近期遭遇,即是此处注脚。从这一点出发,无论是理解征信业的长久“守拙”,还是剖释征信业的逐渐“染指”,抑或观察征信与下游行业达成均衡,都有几分“以史为鉴”的效果。
当平等掺入歧视
对“特定的制度安排是否包含歧视”这类问题,是没有确切答案的。定义何为“歧视”前,需要定义作为基准的“平等”,然而结果平等与机会平等,未必等同。“结果”与“机会”本身也是论说纷扰的概念。基准变易,一方看来无可饶恕的歧视,助长、放大现有的不平等,在另一方看来可能反而是平等的福音。围绕征信,上述冲突尤为突出。
征信有“暗黑”面。衡量偿贷能力时,弱势群体很难奢望获得优待。妇孺、穷苦人、特定族裔,等等,获“信用差等”的概率远超旁人。因出生即无法改变的因素而被苛以较差等级,并因此失去诸多机会,本身便是一种恶,性别歧视与种族歧视等行为之下有深重的集体记忆,并因此不可触犯。最后,无法获得低廉信贷的弱者走投无路、饮鸩止渴,时常是舆论焦点。
然而,信用业也有“光明”时刻。信用自古就有,曾经只有上流社会贵人的信用有意义,普通人的信用是没有大用途的。信用业给每个人都建立了为外界所认可的信用档案。直白地说,如果不是信用业将金融带给每个人,弱势群体或许连被歧视的机会都没有。
这不是信用业唯一的“光明”时刻。“中立”与“科学”,是信用业又一促进平等的因素。在这个“中立”的行业里,个体信息被准确地传输、汇集、提供,内容不因身份而扭曲;在这个“科学”的行业里,上至高官显贵,下至贩夫走卒,二者所“享受”的,是别无二致的评估标准或算法。1970年代时,面对汹涌而至的批评,业内人士的反驳,相比尊重现实、“让数据说话”的办法,针对特定群体调整信用权重才更符合“歧视”的定义。
暗黑与光明的碰撞,催生了1974年《公平信用报告法》(FairCreditRe-portingAct)。据此,信用机构不得基于年龄、肤色、种族、国籍、性别或婚姻状况等因素歧视借贷者,不过对年龄或婚姻状况这两项变量,法律仍为信用机构留出了些许空间。法条的颁布不会终结上述争议,颁布之后已历多次修订。要求大幅删削甚至废除法条的呼声不止一次;要求扩大法条范围,以容纳智力水平、犯罪记录等因素的声音亦不在少数。拉锯,没有止息的趋势。
处理已有或将有的歧视问题,需要放宽眼界。若以普惠作为金融愿景,信用体系自然不能对弱势群体冷漠。可当信用评级等算法主宰日常生活的方方面面,甚至在自动驾驶等场景中操控人命时,过往关于歧视的争论,都会成为某种“谶纬”。
当隐私面临监视
“如何界定隐私”,描述相关研究进展用语中最乐观者,也不过“各持己见”。不过,以下两种定义,已广获认可。一方面,从最朴素的观念看,隐私对应守密,知晓他人不愿让人知晓之事,甚至将之向外散播,自然属于侵犯隐私。另一方面,隐私在很大程度上对应于个体自主,从这一观点出发,侵害隐私的“元凶”并非大型数据库本身,而是很难说算不算透明且无法干预的算法决策。保护隐私的最佳途径不是删除数据,而是让决策机制更加透明。
如何理解信用机构与两种隐私间的关系?对第一种隐私,原书中的一些发现,或与常人直觉不符。早在19世纪中叶诞生之初,信用机构便十分注重隐私。商业局等机构靠大量个人信息牟利。可在实际交易中这些机构对内容“捂”得十分“严实”。购买数据者常常只可在机构建筑内查阅指定条目,不得抄写翻印。甚至连个人信息所涉及的主体都没有权利查看自己的档案。随着交易规模的上升,以及竞争日趋激烈,前述规定逐渐不切实际。尽管如此,征信机构仍对个体信息施以严格控制与防护,制止其自由流通。
信用机构对个人信息的严格控制与保护的原因有以下几点:法律是其一,得知自己“名声狼藉”的个人,不时提起名誉侵犯诉讼;保育市场是其一,任由宝贵材料肆意流传,自身的竞争优势将很快耗散;对生意伙伴的保护是其一,如果信息来源外泄,私底下传递个人信息的合作者,很可能将不会再与信用机构合作。几番制衡下,百来年间,征信机构并未引起大范围的隐私舆论。
然而,同样是在1960年代前后,伴随存储、计算及传输能力的上升,释放了这行业对数据的无尽渴求。1960年代末至1970年代初,相应忧虑攀至顶峰,当诸如“夫妻吵架”一类的琐事都可能录入新兴的计算机信用系统,当雇主频繁购买信用报告以审查入职者,当政府无节制地从信用机构处提取个人信息,诸如“天眼”“透明人”“环形监狱”等譬喻,一时风头无二。与前述规制歧视的规条一致,法律成为应时对策,数据的利用及提供,均因此受到限制。
隐私的两类定义,彼此并非“冰炭不容”。当其中一类隐私受损,另一类隐私的处境通常也不会太好。实际上,如果数据的收集缺乏制约,个体又如何指望机构会“公正”、“透明”地利用信息决策呢?从购物到买房,从求职到投保,生命中许多重大决策上,普通人都经历着卡夫卡所描绘的无力。因信用机构依旧对用户固守的“自律”,他们无从知晓决策所据信息是否错误,遑论更正信息;至于神秘的评估算法,那就更加超出常人理解的范畴了。
歧视导致对“公平信用报告”的规制,滥采引来了限制数据利用及提供的法律,“卡夫卡式担忧”也产生了类似的功效。作为对双方势力的平衡,1970年代,用户始有权力查询、更正数据。无论是保护作为“秘密”的隐私,还是保护作为“自主”的隐私,当代人都在摸索中前行。对个人信息的保护,早已延及收集、使用、分享、销毁等各项环节;作为进一步衡平的尝试,删除权及获解释权,都不再只是纸面上的设想。
将征信机构180余年的历史梳理得清清楚楚,一并勾勒社会各界观念心态的冲突变动,这是本书的首创。原书叙述更偏向“编年”体例,按照时间线索铺陈。然而,比对不同时期的纷争,其中可以抽出共同的主题:数字替代人力,逐利而远中立,待遇多有差别,隐私散落一地,又考虑到“算法滥用”、“平台中立”、“算法歧视”、“数据隐私”等全是目前无可争议的热点,本书立意,可谓远超一般的国别专题史著作。其中唯一缺憾,或许是当代部分稍显薄弱,如果新世纪部分写得足够丰满,全书的意义或可再度拔高。
原书的意义,在当代中国这一语境下尤为凸显。无论是审视信用体系建设,还是议论更广范围内的人工智能建设与数字经济发展,本书都可为切入相应讨论提供多方面的指引,尽管许多支持、反对或表达审慎的命题,过去的人们早已论证或辩驳过。
(作者系对外经济贸易大学数字经济与法律创新研究中心研究员)
免责声明:本网站所有信息仅供参考,不做交易和服务的根据,如自行使用本网资料发生偏差,本站概不负责,亦不负任何法律责任。如有侵权行为,请第一时间联系我们修改或删除,多谢。
© 2018 今日中国财经 版权所有