AI在出版业的应用和问题

 
来源:bob体育苹果 | 发布时间:2025-06-22 22:15:45 | 浏览量:325
 

  2025年1月6日,“书业守正拓新径,新质发展向未来”研讨会在京举办。会上,中国出版传媒商报社执行董事(社长)、党委书记、总编辑宋强发表了主题演讲《AI在出版业的应用和问题》。以下为演讲内容。

  日前,北京市教育委员会等十七部门发布《关于加强新时代中小学科学教育工作的二十条措施》,其中提到,要着力推进人工智能赋能科学教育,开发面向学生的科学教育智能体,为教师教学提供AI助手,为学生学习提供AI学伴。可以说,AI在中国慢慢的受到重视。在出版业也是如此。

  需要说明的是,本文大部分材料和案例是基于《中国出版传媒商报》《国际出版周报》的报道,同时参考了一些其他材料。

  在国外出版业,大致分为支持和谨慎两个阵营。持谨慎态度的方面,主要是担心版权问题。例如在2024年11月14日,欧盟首部《通用AI业务守则》(初稿)发布,详细说明《人工智能法》对通用AI模型和具有系统风险的通用AI模型提供商的规定,制定AI模型训练内容的透明度原则。Stability AI前高管艾德·纽顿-雷克斯称,从2022年开始,一些公司的大模型开始商业化,以学术研究的名义,通过“文本和数据挖掘”版权例外抓取数据训练。

  2024年10月,Fairly Trained平台与包括AAP在内的多家创意权利组织合作,发起大规模的创作者维权声明,抗议AI公司没有经过授权使用版权内容训练模型,约3.6万名创作者签署了声明。目前美国已有30多起针对AI公司版权侵权的诉讼,在这些案件中,AI公司普遍以“合理使用”为由进行辩护。一些政府迫于大型科技公司的压力,正在考虑通过立法途径对版权法做出宽泛的例外规定,包括“避风港原则”以及“文本和数据挖掘”(TDM)的例外规定,这不仅会侵占作者和出版商宝贵的知识产权,有可能导致图书、科技期刊和教材的市场被替代。AI公司取得授权需要时间,不能破坏作者和出版商的利益。

  有的出版社对AI的使用持排斥态度。例如德国Cross Cult出版社版权经理邱瑞晶称,在他们与其他国家出版社的合作中,大多数出版社暂时没用AI创作,也没有列入工作规划。为保护创作者的内容,一些大型出版集团已在合同中加入了禁止完全使用AI为图书绘制封面和插图,以及禁止使用AI录制有声书的条款。

  在支持和持开放态度方面,在应用方面,主要是将AI当做工具来使用,有的出版社已经将技术应用到了出版全流程。在学术及教育出版领域,涌现一波AI工具开发热潮。励讯、威科、培生、施普林格·自然、圣智等国际出版企业均已推出AI工具,如励讯集团(RELX)开发的SciAI、Lexis+AI,威科集团(Wolters Kluwer)开发的的UpToDate AI Labs工具,培生开发的AI教师工具,以及施普林格·自然推出的Geppetto和SnappShot 2款AI工具。施普林格·自然授权作者使用GPT(生成式预训练模型),出版了德文书《GPT在财务、合规和审计中的应用》。各企业将生成式AI引入其数字化平台,基于自有的、让人信服的内容资源,回答用户提问并提供有价值的相关信息,帮助用户加快科研进程并作出更精准、明智的决策。为保障AI使用的安全,这一些企业逐步制定了用于内部管理的AI准则,来负责任地推动AI发展,,包括在隐私和安全,透明度和可解释性,治理和责任,以及公平等方面。

  在大众出版领域,出版机构也开始推进AI在图书出版流程中的应用。如美国哈珀·柯林斯授权微软公司使用其非虚构类老书用于大模型训练,西蒙与舒斯特收购的荷兰VBK出版社使用AI翻译荷兰语图书。

  以色列技术初创公司书脊(Spines)在获得A轮1600万美元融资后,也将在2025年使用AI帮助自出版作者出版8000种图书。以色列Spines利用AI实现了大部分出版流程的自动化,Spines的AI可处理编辑、校对、排版和封面设计等基本任务。通过Spines的平台,作者们可以在两周内出版作品,成本最多可降低30%。Spines的AI封面生成工具能生成吸引人的作者简介,同时还能为图书的封面和封底进行适当的艺术设计,为作者提供70多个范例以供选择。其次,Spines的AI校对工具会扫描作者稿件中的语法错误、拼写错误和错别字,确保最终版本没有错误。在图书出版以后,Spines还为作者们提供AI营销工具,包括营销功能和版税管理功能等。此外,Spines还为作者们提供了AI驱动的有声书制作工具,作者们能够自行选择配音,然后让AI生成有声书,之后作者还可以每时每刻编辑AI有声书的内容,或选择Spines的校对服务。(来自微信公众号“共同虚拟”,2024年5月14日。)

  众多出版机构早已将AI应用于策划、审校、营销等出版生产流程。目前来看,AI应用已覆盖出版生产全流程,且校对、图书设计等细分流程中又有新突破。

  部分出版机构慢慢的开始尝试引入AI技术进行选题策划,通过AI对大量数据和市场趋势的分析,筛选出一系列潜在的选题方向。海豚出版社使用AI技术帮助编辑来构建图书框架和内容方向、帮助形成选题策划方案,并且辅助生成图书简介、宣传与推广文案等内容。他们在使用AI进行选题策划时,会先选出一些题目,再由工作人员进行比对筛选,极大的提升了工作效率。

  在编辑加工环节,AI技术能实现自动校对、编辑加工等功能,是出版行业AI技术应用最为广泛的一个层面。如,人民卫生出版社推出的人卫标准临床专科知识库,原先需要两年完成的编写工作,借助人工智能之后用6个月便可完成。中国教育出版传媒集团研发的智能编校平台,可提供用户画像、作者画像、多模态智能审校等技术上的支持,进一步解放和发展了编辑生产力。

  蜜度研发出国内首个专攻智能校对场景的垂直领域大模型——文修智能校对大语言模型

  从智能校对平台提供方看,典型案例包括蜜度研发出国内首个专攻智能校对场景的垂直领域大模型——文修智能校对大语言模型。2024年,文修2.0首次达到70亿参数规模,训练数据规模约8000亿词符,并通过构建更完善的数据质量评估模型,保障了内容多样性和数据质量,“90秒校对审核20万字”。

  果麦文化研发的人工智能校对工具“果麦AI校对王”在中文校对领域展现出优异性能,针对中文的语言特性进行了多层次的特别优化,引入超过百亿字级别的壁垒级训练数据 “中文出版物校对全流程数据集”进行高精度训练。“果麦AI校对王”目前已确定进入公测阶段,在纳入果麦文化书稿质检标准流程的同时,超过20家出版单位投入使用。

  海豚出版社在校对环节充分应用AI技术,通过AI与人工校对的协同作业,实现了较高的错误检测率,黑马校对软件在其校对中扮演了核心辅助角色。

  在插画设计方面,绘画作品成为出版机构应用AI的主要场景,各出版机构结合自己实际,伸出了尝试AI绘画的触角。2023年,福建少儿出版社率先于旗下低幼杂志《画报》上刊载了一篇名为《熊》的全AI绘图科普作品。2024年初,福建少儿社将AI板块业务正式立项,成立了“AI应用与美术编辑室”,并建立了“辅助出版AI项目”。其间使用AI工具为福建少儿社20余种图书创作了包括封面、插画等多种类型的图片。如《森林画报》全套4册,每册6印张(96码),总计400张图片,采用满版设计,全部由AI生成,历时4个月。

  2024年,童趣出版公司有多套图书使用AI绘图进行插图绘制及版式设计优化。例如,与“亲近母语”合作出版的分级诵读绘本《小步日诵》,全书384幅插画,均采用AI绘图与人工调整相结合的方式完成。

  童趣出版公司《小步日诵》全书384幅插画均采用AI绘图与人工调整相结合的方式完成

  北京看山科技有限公司创始人梁翃为多家出版机构提供绘图服务,“AI绘图已将复杂的人工绘图成本降低80%以上”,效率提升最高的插图类型是标准化插画,如词汇类、字典类配图,画面风格统一、插画内容简单不需要复杂的场景、动作、表情,这样的插画类型相对于人工效率提升,可达百倍以上。其设计团队只有10个人,1个月可以画1万张图。相对于原有人工插画师,平均效率提升10~30倍。目前已经与童趣出版公司合作了绘本插图设计,与吉林科技出版社合作了儿童科普图书,与中国少年儿童新闻出版总社合作了期刊内页设计,与吉林出版集团外语公司合作了“快乐读书吧”丛书插图设计。

  随着数字人技术逐渐成熟与落地,慢慢的变多出版机构针对主力图书方向,打造多人设、多形象的数字人营销矩阵。如中华书局继推出“数字人苏东坡”后,又投入开发“花木兰3D超写实数字人”;数传集团AI小助手“书小二智能图书数字人”在百余家出版单位推广应用;东方出版中心的AI数字主播“东东”“芳芳”、河南大学出版社的数字人“AI河南文化研究员”、广西师范大学出版社集团的AI数字人“小珂”、果麦文化的“AI读书数字人”、四川人民出版社的AI数字人“皮艾可”、中信出版的“凯文·凯利数字人”、中图云创智能科技(北京)有限公司的“马可波罗数字人”等应用探索,均是出版人对科技应用与文化创新的一次革新。

  近年,中信出版集团自主研发了“智能出版平台”,将版权研究、内容生产、视觉生成、营销策划等关键业务环节与AI相结合,大幅度提高图书出品质量、生产效率和推广效果。其中,针对出版业务全流程的智能化重构,搭建了万象亿新智慧出版体系,作为数智化的核心产品和业务基座。

  高等教育出版社于2023年初,开始建设高教社H0大语言模型,在H0模型基础上通过增量预训练、微调等方式构建H1学科大模型、H1编辑出版大模型,提前布局多模态大模型,同时推动各平台联动,拓展人工智能出版领域场景应用。社内数据中台为大模型技术提供丰富的数据资源,大模型为数据中台提供更智能、高效的数据分析和处理能力。

  目前已有多家出版机构接入百度“文心一言”,尝试将AI大模型运用到选题策划、编辑校对、美术设计等出版流程。还有部分出版单位基于自身的业务需求,自主投入建设人工智能大模型。

  应用AI技术的融媒体图书在各大出版机构遍地开花,其中,基于图书内容制作与读者互动交流的数字人已成为不少出版机构的新尝试。华东师大出版社自2022年起开始布局“AI智慧教辅”系列,目前已成功在教育汇APP上线“智慧AI”栏目,为用户更好的提供“AI智慧批作文”服务。

  二十一世纪出版社集团与江西省出版传媒集团旗下的朗知传媒公司合作,探索AI绘图运用,与浙江大学及深圳快语科技公司合作开发“智能交互阅读平台”项目,将优质图书进行智能化内容转换,通过自研的“读者服务号”平台为读者提供伴读机器人。

  中图云创公司基于《马可波罗行纪》一书的内容“复活”了马可·波罗,其独家数字人形象在2024年7月的“马可·波罗奇迹之旅”展览上首次亮相。马可·波罗数字人可以与观众进行实时对线多年前的东方之旅。

  童趣与数传集团合作,为《迪士尼经典动画英文电影故事》一书配备了AI学习助手,读者打开学习助手,不仅仅可以获得该书配套的各种学习资料,还可以与学习助手聊天、提问,进行互动。

  少年儿童出版社与数传集团合作推出的《寻找匹诺曹》,读者只需扫描书中的二维码,能与专门为该书量身定做的AIGC数字人“AI诺贝尔”交流对话。

  海豚出版社联合数传集团,以RAYS平台为应用基础,利用微信小程序为互动渠道,用AI技术打造沉浸式角色互动体验,在元宇宙中,读者可以与书中的AI角色进行互动交流。

  “京师书法”则是京师讯飞推出的一套简单易用的书法教育信息化系统。“京师书法”使用先进的人工智能评测技术,通过构建数据驱动与书法知识引导相结合的方式,构建书法图像深度配准算法与DeepLabV3深度神经网络相结合的笔画语义分割算法,再利用Mask R-CNN卷积神经网络,精确提取细粒度笔画图像的深度视觉特征模式,高效拆解书写字笔画,并基于书法领域的多元评测策略,构建形式化语义,建立多模态语义特征的书法字测评机制,实现了以多特征联合推理为核心的书法字测评算法,大幅度的提高了评测的专业性与准确性。

  凤凰出版集团旗下的学科网等公司利用AI技术提供智慧教学应用、效率提升工具和赋能新品。高等教育出版社将大模型技术运用于在线教育和教材,包括智能备课、智能出题组卷、教学资源推送、个性化学习和智能答疑等。AI技术给专业出版领域带来了许多新的机会。

  掌阅积极地推进人工智能大模型在数字阅读垂直领域的应用,充分的利用在内容版权资源、创作者生态、海量用户资源等领域的优势,将国内领先人工智能大模型和公司内外部业务场景进行深层次地融合。近日,最新AI应用功能“掌阅AI辅助阅读”正式上线,在数字阅读“掌阅”APP现有功能基础上,通过调用国内优秀人工智能大模型的生成能力,赋能用户读前、读中、读后等关键环节,贯穿选书、看书等核心流程,并通过“掌阅书童”智能阅读助手实时答疑解惑,为读者提供更丰富和高效的阅读交互方式。

  国内不少出版机构已探索出AI赋能学术出版的新路径。2023年7月,中华医学会杂志社学术期刊出版服务平台正式上线,成为国内首个将AIGC引入期刊采编评审系统的学术期刊出版单位。编辑能够最终靠这一AI写作检测工具,对所有投递至社内的论文进行扫描检测,查看AI写作的段落以及可疑度。方正电子自主研发的学术出版信息化平台“方正鸿云学术出版云服务平台”。该平台自2019年上线以来,助力期刊逐渐完备学术传播生态,与Pubmed、Medline、EI、Scopus等60余家第三方实现对接,并与万方文察、中华医学会杂志社等机构携手合作,推动多维度的诚信问题查验,探索在提升学术质量、提高科研效率方面合作的可能性。

  人工智能在赋能出版发展的同时,也带来了多维度难题,包括管理难题、技术难题、版权风险、出版数据安全问题等。

  AI技术大范围的应用于出版各流程的同时,必然导致出版流程的重塑、人员岗位的调整、组织架构的再造和运营机制的变革,进而倒逼出版管理模式做调整。出版机构需要在岗位设置、组织架构、资源配置、管理机制等方面有适配AI应用的管理变革。一些出版机构仍就保持传统出版管理模式,这将无可避免地导致管理与生产方式脱节,甚至阻碍出版机构的发展。

  目前,AI使用的过程中,面对的主体问题还是AI工具“智力”不足。一是算力不足,导致效率低下,严重时会出现系统崩溃;二是人工智能“智力”有限,现阶段的AI在大模型数据和理解力上还有很大局限,在其熟悉的领域有非常惊艳的表现,但在大模型数据较少的领域容易陷入偏差,有时需要大幅度介入人工力量。

  数字主播像一阵风已不再流行,根本原因是技术还不够成熟,人物表情、动作、语音逼真度还不够,整体上过于“套路化”,没有亲切感。数字主播做直播技术也不成熟,无法与用户互动,情感化程度不够。

  AI生成内容是否应当受到著作权法的保护是近年来知识产权法学界热议的问题,AI生成内容的侵权问题也广受关注。尽管当前我国著作权法并未对相关主体获取数据库的数据作明确规定,但是相关主体获取并使用数据库内的数据仍要事先取得数据库权利人的许可。部分训练数据属于著作权法意义上的作品,相关主体使用这一些数据同样要事先取得作者的许可。生成式AI的开发者在面临这一困境时,往往选择在未获取授权的情况下直接用作品来进行预训练,非常有可能产生侵权。此外,生成式AI的生成内容与原训练材料差别不大,二者之间有实质性相似,生成式AI向多个用户传播该内容可能会存在侵犯作者信息网络传播权的风险。目前,还没有关注到AI公司向出版机构支付数据使用费的案例。

  出版机构在是否接受AI生成内容方面的态度则不一致,有的出版机构明确不接受AI写作的稿件,如上海果麦强调著作权的合规审核流程,明确禁止使用AI稿件,但多数出版机构并未特别强调禁止AI稿件,一些出版机构则通过AI生成内容来提高内容产出效率、降低内容产出成本。例如,9岁的许萌萌在智谱清言、ChatGPT等人工智能大模型产品的帮助下,通过个人设计故事框架,不断提出问题,创作了一本多个章节、近200页的书——《AI少年——火星生存大挑战》,2024年5月在电子工业出版社出版,开卷监控销量当年共售出2929册。

  数据隐私和内容安全问题是AI在出版应用中需要高度关注的问题。在数据隐私方面,随着AI系统的广泛应用,大量的个人数据被收集和分析,要建立健全数据隐私保护机制,确保用户的隐私得到充分保护。同时,防止数据被不当使用和滥用,防范安全风险和数据泄露。在内容安全方面,不同的大语言模型由于算法设计不同,有几率存在潜在的偏见。这导致它们对相同的问题可能会产生不同的答案,有时甚至会维护部分国家或少数群体的利益,从而引发内容安全方面的隐患。

  素材库的建设是当前AI技术在出版应用中面临的重要难点。AI应用平台的数据库数据不足导致难以精准地针对客户开展个性化推荐,且推荐内容亦显单调匮乏。此外,技术在生成图片时依赖于素材库的学习,若素材库中缺乏相关联的内容,AI生成的图片便会出现一些明显的异常问题。对于科普类图书而言,在知识点查证上,AI虽能快速提供海量信息,却常因缺乏准确性判断而受限。

  面对AI技术的发展和应用,作为出版人,要保持战略定力,不用恐慌,也不要一拥而上。我们要达成行业共识,明确AI使用的范围和存在的边界。对下一步工作,有三点建议。

  一是形成出版业AI使用规范。对一些用AI创作的图书,要明确标识;用AI工具创作的漫画、插图也要明确标识,要让读者在阅读之前就先了解图书是否是AI创作的。

  二是尊重原创,鼓励原创。在某些出版类别,要明确AI创作,例如文学出版领域,我个人是明确反对阅读AI创作的作品的,文学创作是作家观察体验生活、倾注情感创作完成的,读者在阅读中最宝贵的体验就是与作者发生共鸣。我不相信用AI创作的作品会成为“高级货”,即使用所有世界文学名著作为碎片化语料创作完成的作品,也不会有任何价值。

  三是与AI公司密切沟通,充分的发挥版权资源优势,确保作者和出版社的合法权益和收益。

  在国家政策的支持下,在行业协会的引导下,相信出版业在AI技术应用方面会取得更大成绩。

 
 
上一篇:第18届中国五金产品国际工业设计大赛颁奖 智汇五金 搭建创新与产业转化桥梁
下一篇:冷芸时尚圈推荐第6版 时尚相关的书单、网站、社交账号、APP、工具、空间等