看文件,ddl 是 6.7,字数不少于 3000 字,占总成绩的 50%

初步的想法

大语言模型+网络综合治理

首先梳理网络综合治理中有什么样的重点、难点,再介绍大语言模型的特点、能力,尝试论证用大语言模型进行网络综合治理的可能性,好处和潜在的坏处,如大语言模型的政治倾向、安全性、不可解释性

网络综合治理的基本含义和历史来源 (800)

  1. 什么是综合治理

““综合治理”概念肇始于社会治安领域,最早可追溯至 20 世纪 60 年代毛泽东批示的“枫桥经验”,主要内容是发动和依靠群众,坚持就地解决问题,保证矛盾不上交” 王丛虎. 中国“综合治理”的演进与创新

“社会治安综合治理强调的是“标本兼治,重在治本”[6],核心是要充分动员社会各个层面的广泛主体[7],综合方方面面的资源、力量以及手段,形成齐抓共管出合力的良好局面,以保持社会治安的基本稳定。” (韩志明和刘文龙, 2019, p. 1)

“2011 年,中央政治局召开会议专题研究加强和创新社会管理问题,提出要“形成党委领导、政府负责、社会协同、公众参与的社会管理格局”[8],意味着“综合治理”开始拓展到所有社会治理领域,而不再只是局限于社会治安领域” (韩志明和刘文龙, 2019, p. 1) 胡锦涛主持中共中央政治局会议研究加强和创新社会管理问题

“党的十九大报告明确提出,要“加强互联网内容建设,建立网络综合治理体系,营造清朗的网络空间”[10],正式提出网络综合治理体系的命题。” (韩志明和刘文龙, 2019, p. 1)习近平. 决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利———在中国共产党第十九次全国代表大会上的报告 ( 2017 年 10 月 18 日) [N]. 人民日报,2017 - 10 - 28.

“我们这里基于党和政府的重要文献表述,借鉴理论研究者们的观点,特别是参考有关社会综合治理的定义,将 “网络综合治理”定义为: 网络综合治理是在各级党委领导下,由政府承担管理主导责任,各有关部门充分发挥职能作用,依靠企业履责、社会监督以及网民自律,做到协调一致、齐抓共管,综合运用经济、法律、技术等多种手段,打击和预防网络违法违规行为,完善网络社会管理,化解网络社会矛盾,以实现网络秩序规范、网页内容健康向上以及网络空间清朗清净,切实维护公民、企业和国家的合法权益。” (韩志明和刘文龙, 2019, p. 1)

  1. 网络综合治理模式的发展 “前瞻性、针对性、开放性的关于信息化建设的论断,包括国家信息化发展战略、信息资源开发利用、信息人才培养等内容,推动出台了一系列具体决策” (傅昕源和黄福寿, 2022, p. 20)

“邮政、电信、广播、电视等行业实行了“行政性分业管理领导体制”的运行模式,明确了“国家、地方、集体、个人一起上” 以及“统筹规划、条块结合、分层负责、联合建设”的方针” (傅昕源和黄福寿, 2022, p. 20) 国家发展改革委经济体制综合改革司,国家发展改革委经济体制与管理研究所 . 改革开放三十年:从历史走向未来[M]. 北京:人民出版社,2008.

“开启了中国互联网时代,信息基础建设与关键资源配置、机构改革与职能配置都进入了新的历程,对于各类信息网络也从“分业管理”逐步进入跨部门协调管理的转型。” (傅昕源和黄福寿, 2022, p. 20)

1997 年,全国信息化工作会议通过“国家信息化九五规划和 2000 年远景目标”,将互联网列入国家信息基础设施建设,同年成立中国互联网信息中心,作为非营利管理与服务机构,行使国家互联网信息管理的职责,推动中国发展互联网服务。至此,跨部门协调管理基本成型。

“2010 年,基于文化体制改革和产业环境快速成长的需求,国务院作出“加快推进电信网、广播电视网和互联网三网融合” 的决定,实现三网互联互通、资源共享。2011 年 5 月,国家互联网信息办公室成立,三网融合有了基本的机制保证。” (傅昕源和黄福寿, 2022, p. 20) 国家发展和改革委员会 . 国家及各地区国民经济和社会发展“十二五”规划纲要(中)[M]. 北京:人民出版社,2011.

2017 年,党的十九大报告提出,要“加强互联网内容建设,建立网络综合治理体系,营造清朗的网络空间习近平

网络内容治理 (800)

  1. 概念的演变

“在早期电子公告栏时代,BBS 论坛、网络聊天室、网络留言板的出现让普通网民也拥有了发布网络内容的资格,传播者和接受者的界限开始模糊。” (谢新洲和朱垚颖, 2021, p. 69)

“针对这一时期的网络内容,2000 年 9 月国务院出台《互联网电子公告服务管理规定》,要求网络上各类电子国内公告服务必须进行专项备案,该规定还较为详细地列出了禁止发布的信息条目及违规惩处条款。这一阶段网络内容的管理工作刚刚起步,主要针对平台服务商进行强制性管理,主要以备案、禁止、惩处等硬性手段为主。” (谢新洲和朱垚颖, 2021, p. 69)

进入 21 世纪,新浪、网易、搜狐等商业门户网站和传统媒体的新闻网站成为网络内容发布和传播的重要平台,网络新闻成为网络内容的关键组成部分。这一时期的网络内容开始具有丰富多元的属性,尤其随着带有官方属性的网络内容出现,使得网络内容的重要程度和主题覆盖度得到提高” (谢新洲和朱垚颖, 2021, p. 69)

“因此,网络内容治理也开始强调软性手段和硬性手段的结合,行业协会开始成为政府和企业之间的中介沟通层,如 2001 年 5 月建立的中国互联网协会等” (谢新洲和朱垚颖, 2021, p. 69)

“从单一的集权式管理模式转变为治理模式的“多元主义”④” (谢新洲和朱垚颖, 2021, p. 69)

“2009 年起,博客、微博、微信等社交媒体平台成为内容发布传播的重要平台,使得网络空间的内容传播走向碎片化、移动化的“社交时代”⑤,治理主体数量迅速增长” (谢新洲和朱垚颖, 2021, p. 69)“这一时期的网络内容治理面向的内容对象更加海量、碎片,治理主体上开始重视企业、网民等其他主体的参与。” (谢新洲和朱垚颖, 2021, p. 69)“。也正是在这一时期,中国的网络内容治理从“ 权威管理 ”转向“ 共同治理 ”⑥” (谢新洲和朱垚颖, 2021, p. 69)

  1. 内容治理方式的发展

“针对这一时期的网络内容,2000 年 9 月国务院出台《互联网电子公告服务管理规定》,要求网络上各类电子国内公告服务必须进行专项备案,该规定还较为详细地列出了禁止发布的信息条目及违规惩处条款。这一阶段网络内容的管理工作刚刚起步,主要针对平台服务商进行强制性管理,主要以备案、禁止、惩处等硬性手段为主。” (谢新洲和朱垚颖, 2021, p. 69)

“因此,网络内容治理也开始强调软性手段和硬性手段的结合,行业协会开始成为政府和企业之间的中介沟通层,如 2001 年 5 月建立的中国互联网协会等” (谢新洲和朱垚颖, 2021, p. 69)

“从单一的集权式管理模式转变为治理模式的“多元主义”④” (谢新洲和朱垚颖, 2021, p. 69)

目前网络综合治理的现实问题 (800)

“网络治理的顶层设计规划较为理想,但中端实施、末端落实的过程中,由于体制机制尚未理顺缘故,容易出现执行偏差、权责不一、多头管理等问题,严重制约网络治理效率” (张旺, 2019, p. 1)

  1. 对于网络综合治理的理念的理解不够正确
    1. 观察视域局限:对网络社会治理的观察视域较为狭窄,过于强调对网络风险的规制,忽略了网络社会与现实社会的关联。
    2. 治理主体、对象、方法模糊:对治理主体、对象和方法的界定不够清晰,缺乏对网络参与者治理主体地位的认识。
    3. 与国家治理理念关系不明确:未能充分揭示网络综合治理与国家治理理念的内在关系,缺乏对治理模式和发展理念的系统性分析。
  2. 基层组织作用不足
    1. 基层党政部门:虽然有强烈的治理意愿,但存在能力不足、本领弱化和资源不均衡的问题,导致无法掌控网络空间中的一切。
    2. 企业:虽然掌握着较为充足的技术性资源,但更多是被动参与治理,以追求资产增值和利润变现为目标,参与常态化治理比较有限。
    3. 社会组织:虽有一定的治理意愿,但由于发展较晚,行政依附性较高,聚合能力相对薄弱,还未能有效弥补政府在网络综合治理中的不足。
    4. 网民:大多数网民受教育程度和网络素养不高,缺乏参与网络治理的意愿和技术能力,对网络社会问题持漠不关心的态度,成为”沉默的大多数”,缺少持续性、深入性的治理参与。
  3. 网络执法困难
    1. 硬法还不硬:法治制度设计的滞后性导致政府管理在面对网络社会的新情况和新问题时显得迟缓。立法程序繁复、时间成本高,无法及时跟上互联网技术的演进周期,立法效率和前瞻性有待提高。
    2. 软法还太软:企业履责、社会监督和网民自律缺乏非正式的制度规范,德治制度化不完备。一些互联网平台企业在用户上传内容的监管和管理方面存在问题,责任认识不充分,角色定位不准确,制度机制不完善,管理操作不规范。政府难以直接掌握信息内容生产的全过程,处理违法有害信息的速度赶不上信息被制造的速度,监管能力有限。

Cite

中国网络综合治理的历史生成、现实问题与发展进路

网络空间清朗是网络治理现代化的发展目标和努力方向,在达成这一终极目标的过程中,建构形成一个集智能化、生态化于一体的网络综合治理体系 ( 见图 1) ,从智能化治理与生态化治理两条主线出发,探讨解决网络综合治理难题,是现阶段网络治理的主要着力点和发展方向。 3. 1 网络综合治理体系智能化网络综合治理体系智能化代表着网络治理由经验治理向科学治理、由静态治理向动态治理的升级转型。随着人工智能、大数据等技术的迅猛发展,智能技术与网络治理之间的关系更加密不可分,也发挥着更为重要的作用,拓图 1 网络综合治理体系组成结构图展了网络治理的方法手段,推动了网络综合治理向着更为智能的阶段和更为广阔的视域方向发展。智能化的网络综合治理体系,主要指人工智能、大数据、云计算等技术在网络治理领域发挥明显技术功效,形成了技术驱动下的治理流程,这些新兴技术能够有效解决网络空间自有的海量数据和复杂隐匿等难题,提升网络治理的精准度。如人工智能、大数据等技术,能够有效加强网络数据的保护能力,通过完善的技术应急预防机制,严格规范个人信息的收集、使用、存储等,个人信息和重要数据将得到有效保护,同时通过采取开源方式共享网络安全威胁信息和相关技术,能够准确掌握网络安全威胁实际情况,全面提升网络治理水平,并对网络风险作出有针对性地防范举措,实现基于技术的智能治理 (张旺, 2019, p. 2)

在网络综合治理中引入大语言模型的可能性探讨 (800)

什么是大语言模型

语言模型是一种用于提高机器语言智能的方法之一。它旨在对词序列的生成概率进行建模,以预测未来或缺失单词的概率。语言模型的发展经历了四个主要阶段:统计语言模型(SLM)、神经语言模型(NLM)、预训练语言模型(PLM)和大语言模型(LLM)。

统计语言模型(SLM)是基于统计学习方法开发的,早在 20 世纪 90 年代就开始兴起。它们基于马尔可夫假设,建立词预测模型,例如根据最近的上下文预测下一个词。其中,具有固定上下文长度的 SLM 被称为 n-gram 语言模型,例如 bigram 和 trigram 语言模型。SLM 在信息检索和自然语言处理任务中得到广泛应用,但受到维数灾难的限制,难以准确估计高阶语言模型。F. Jelinek, Statistical Methods for Speech Recognition. MIT Press, 1998.

神经语言模型(NLM)使用神经网络(如循环神经网络)来建模词序列的概率。它引入了词的分布式表示概念,并通过聚合上下文特征构建词预测函数。NLM 的发展推动了表示学习的应用,如 word 2 vec,用于学习有效的分布式词表示。Y. Bengio, R. Ducharme, P. Vincent, and C. Janvin, “A neural probabilistic language model,” J. Mach. Learn. Res., vol. 3, pp. 1137–1155, 2003.

预训练语言模型(PLM)是在早期尝试中提出的一种方法。它通过预训练一个模型来捕捉上下文感知的词表示,然后在特定下游任务上微调该模型。PLM 的代表性模型包括 ELMo 和 BERT,它们使用自注意力机制和 Transformer 架构来生成通用的上下文感知词表示,大大提高了自然语言处理任务的性能。A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, L. Kaiser, and I. Polosukhin, “Attention is all you need,” in Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017, December 4-9, 2017, Long Beach, CA, USA, 2017, pp. 5998–6008

大语言模型(LLM)是对预训练语言模型的扩展和拓展。研究人员发现,通过扩大模型的大小或数据规模,可以提高下游任务的模型容量。LLM 的训练通常需要处理大规模的数据和分布式并行训练,它展示了出色的涌现能力,能够在复杂任务中展示出前所未有的强大和有效性。GPT-3 和 PaLM 等大型预训练语言模型的出现掀起了人工智能领域的革命性变革。

大语言模型在网络空间治理方面的优势

主要问题

如果大语言模型用于网络内容治理,可能会出现以下问题:

  1. 误判和过滤错误:大语言模型可能会误判某些内容,导致合理的、合规的信息被错误地标记为违规或不适宜。这可能会导致合理内容的过度限制和审查,影响言论自由和信息的流通。

  2. 偏见和不公正:大语言模型可能受到原始训练数据中存在的偏见和不公正的影响。如果这些模型被用于内容治理,它们可能会基于这些偏见做出不公正的决策,导致特定观点或群体受到不公平对待。

  3. 缺乏透明度和解释性:大语言模型通常是黑盒模型,难以解释其具体的决策和过滤原则。这使得用户和内容创建者很难理解和对抗不合理的过滤和审查决策。

  4. 技术滥用和对抗:如果大语言模型的内容治理功能被滥用,它们可能会被用于审查和限制合理的言论,压制异议和批评,或者用于散布错误的信息和假新闻。此外,人们可能会试图对抗这些过滤系统,以绕过其限制,导致技术与滥用之间的不断博弈。

  5. 侵犯隐私和数据滥用:使用大语言模型进行内容治理可能需要访问和分析用户的个人数据和通信内容。如果这些数据被滥用或未经适当保护,可能会导致隐私侵犯和数据滥用的问题。