由中国技术交易所、清华五道口金融科技研究院金融安全研究中心牵... 点击查看
行业观点
数据要素 数据治理 数据安全 数据资产评估
考生须知
数据交易师关注二维码 扫码关注官方微信 预约考试公开课
当前位置: 行业观点> 数据安全> 详情
《“数据要素×”人才培养评价体系建设》标准起草单位征集
《“数据要素×”三年行动计划(2024—2026年)》

让算法应用更加规范

        算法(Algorithm),原本只是解决特定问题的数理路径,但现在作为人工智能的“底层代码”,已经嵌入社会资源的调配过程。毫不夸张地说,基于算法的智能应用,正逐渐改变着人们的“存在方式”——社交媒体塑造电子身份、出行软件记录活动轨迹、电子黄页等革新生活方式、网络商城改变消费理念、搜索引擎划定知识边界、生成式人工智能主导知识传播。就此而论,“算法社会”已经悄然降临。

  算法可能引发的风险及成因

  算法虽具有便利生活、改善决策、提高效率、优化产能等优势,但同时也因缺乏有效的规制而存在诸多难以根除的风险,第一,过度依赖算法决策。即便是经验丰富的司机,完全离开手机导航,也会有如坐针毡之感。随着辅助性算法日趋频繁地介入人们的日常决策,算法同人类的关系好比“象与骑象人”,很难确定最终决定行走方向的究竟是作为潜意识的大象,还是作为显意识的骑象人。第二,“信息茧房”充斥信息获取过程。大型语言模型打底的生成式人工智能可轻易实现海量内容的海量生产,若辅之以基于推荐算法的“精准推送”,人们将被困于由人工智能主导的“信息茧房”之中,甚至将不得不迎合由算法所引导的潮流。第三,技术黑箱所隐匿的决策偏误。数据集偏差、编程人员的自我价值负载都可能导致非中立、不公正的算法结果。资信审查算法对于不同性别的利率差等,反映出算法对既有社会性偏见的强化,AI聊天软件屡屡发表的有喜好偏见的言论,更是对这一问题的直观体现。

  算法运行原理及步骤

  无论是乘客在网约车平台选择不同档次的出租车、用户在手机短视频应用中的互动,抑或是商业银行通过评分系统考察客户资信等,这些日常行为所包含的算法活动可大致划分为三个典型步骤:第一步,平台端通过(主动或被动的)数据挖掘,获取用户、消费者及同类群体的原始数据,例如所在位置、健康信息、消费记录、浏览历史、行为言论、运动轨迹等;第二步,云端将规整后的数据输入机器学习模型,输出概率、排名、风险、倾向、估值等具有明确指向性的分数和结果;第三步,应用终端生成可供决策的评价和预测报告,例如,搜索引擎生成排序界面、自动驾驶系统规划行车路径、问诊机器人给出医疗建议、出行帮手设计旅行方案、电子商务网站识别消费偏好并推送广告、平行管理与控制的混合增强智能框架进行虚拟现实等。

  人工智能的“智能”水平,事实上同“人工”在上述步骤中的含量成反比,但这并不能否认适当的“人工”干预对于风险治理的效果。工具的好坏取决于使用它的人,促进算法向善的关键在于算法背后的人之向善。从前述步骤拆解来看,有必要将“以人为本”的精神贯彻运用至算法活动的全流程。算法应用具有显著溢出效应,正确使用可推动经济社会各领域从数字化、网络化向智能化加速跃升,实现对社会、经济和生活的全面推动。尤其是先进的法律制度可以为确保算法活动不至于具有胁迫性而建立防火墙。

  算法治理及对策

  对算法规制的目标在于:一方面,防范本来应当是中立的人工智能应用,成为少数人的集权;另一方面,为技术优势方和算法受众提供商谈场域,避免法律沦为“技术寡头”的帮凶。回顾算法活动的典型步骤,规制算法技术风险可从以下三方面展开。

  保障用户和受众享有不受算法“支配”的权利。算法因异化而膨胀出的权力越是绝对,人类的尊严就越受威胁。只有在决定自身利益的关键事务上享有积极参与的权利,人类才有可能维持和延续在知识、经验和道德上的卓越。为此,有三个层次的权利,效果从低到高依次为允许数据主体修订或替换不合理数据的“更正权”、允许数据主体要求数据控制者擦除关于其个人数据的“被遗忘权”以及允许个体不受自动化决策限制的“脱离自动化决策权”。

  加强以预期效果为导向的信息披露。“算法透明”一直是算法规制的重点方向,但各国政策制定者就如何实现“算法透明”观点不一。2021年我国国家互联网信息办公室和工信部等部门联合发布了《互联网信息服务算法推荐管理规定》,要求算法推荐服务提供者制定并公开算法推荐服务相关规则。落实算法透明的核心在于有效披露算法决策的逻辑、运算和分析过程。为此,技术方必须主动解释清楚智能应用的软硬件和外部环境之间的相互作用将如何影响算法的行为模式,并清晰直观地就以下事项作出真实、准确、完整的信息披露:第一,供机器学习模型使用的数据的来源、典型特征和分类方式;第二,终端程序的运作原理、代码逻辑和预期效果;第三,可能存在的系统偏差、运行故障和矫正机制;第四,智能应用的即期效果和远期影响。对于算法程序的重大修改,技术方有必要及时进行补充信息披露。

  确保责任主体链条的追踪识别。目前,随着机器学习的不断进步以及数字技术的相互开源,很多算法程序已经自我改良到可能完全偏离其创作者预设但尚未获得独立法律地位的地步,这种复杂性进一步加大了损害赔偿诉讼确定责任主体的难度。在人工智能主体尚未获得明确的法律地位之前,确保其算法程序能够被追踪至可识别的造物者是当前责任体系构建的基础。可资借鉴的制度设计是无人机牌照试点,如,强化算法运用的事后监管和效果追踪,倒逼技术方事先排除某些会产生不公现象功能的置入。对于集成不同来源、多个算法程序的人工智能应用,跨境数据传输中的常见业务关联协议,提供了可类推适用的解决方案,可考虑在封闭应用和开放应用中都置入硬核编码的审计日志,以便为将来可能的责任划分留下记录。

(来源:学习时报)

让算法应用更加规范