AI时代,内容为王:人工智能与出版业 励讯高级副总裁张玉国主题演讲

2023年8月29日

励讯集团中国区高级副总裁 张玉国

 

生成式AI的面世对内容创作和信息获取的逻辑带来了颠覆式的变革,同时也引发了媒体多轮热炒。在新的AI时代,传统出版行业怎样才能赢得未来?

 

8月15日,在2023 年第七届科技出版“走出去”研讨会暨上海交通大学出版社成立40周年活动上,励讯集团中国区高级副总裁张玉国发表了以《AI时代,内容为王:人工智能与出版业》为主题的演讲。张玉国认为,在人工智能时代,高质量、可信任的数据(内容),对用户需求的深刻理解,先进的技术与平台,负责任的AI原则,将是专业出版机构致胜的关键。

 

图片

AI,其实没有那么“新”

在“大数据”这个词火起来之前,励讯集团已经有20年做大数据的历史,在人工智能特别是以Chat GPT为代表的生成式AI火起来之前,励讯集团已经有超过10年应用人工智能的历史。有理想有远见的专业出版(信息服务)机构一直在默默的利用AI技术开发产品并在行业内应用,这与媒体热炒是有本质区别的。


什么是AI?一个比较有代表性的就是维基百科的定义。AI本质上是一种机器智能或软件,其主要功能包括搜索引擎、推荐系统、理解人类语言、自动驾驶汽车、生成或创意工具、棋类等战略游戏。大家去翻一翻人工智能最经典教科书《人工智能:一种现代方法》,也就是这样一个范围,这几个关键词。如果按照这个定义,励讯集团四个业务板块都在应用AI。

励讯集团与AI

今年7月,美国媒体U.S.News评选出了全球十大最有可能从AI技术获益的公司,励讯集团就名列其中。名单中也包括微软、Alphabet、Meta、百度等等国际知名技术公司。

在处理文本数据场景下,在生成式AI(generative AI)变为热门话题之前,广泛应用的人工智能技术主要是提取式AI(extractive AI),最典型的应用就是搜索、推荐、预测。励讯集团旗下的科研信息分析公司爱思唯尔,以及法律信息服务商律商联讯,其产品就广泛使用提取式AI技术,从大量文本(科研论文、学术期刊、法律法规和案例等等)之中提取关键知识点和洞察,为专业人士提供解决方案。

 

生成式AI技术在2017-2018年前后出现,励讯集团一直密切关注。今年5月,集团旗下法律业务板块律商联讯就推出了Lexis + AI,科技和医学板块爱思唯尔也在今年8月也推出了Scopus AI。

律商联讯 Lexis+ AI,2023年5月推出

点击了解爱思唯尔Scopus AI 强大功能

生成式AI在法律行业有巨大的商业机会。今年3月份律商联讯公司针对近5000名法律从业人员做了一个调研,调研结果显示,84% 的人认为生成式AI工具将显著提高律师、律师助理或法律文员的效率,应用领域主要在问题研究、起草文件、精简工作和文件分析等方面。


那么AI会不会取代律师?不会的。参与调研的一名律师说的一句话特别好:“AI不会取代律师,但使用AI的律师将会取代不使用AI的律师。”

 

机遇与挑战并存

生成式AI技术潜力巨大,但也带来很多挑战,比如幻觉(hallucination)、事实错误、偏见、数据安全和隐私保护、知识产权保护、虚假信息等等。“AI教父”辛顿甚至认为,大语言模型可能会对人类的生存带来威胁。在这里我想主要谈谈,AI对专业出版领域有哪些影响。

 

比如说AI的幻觉问题。生成式AI会生成完全捏造的信息,既不准确、也不真实,就是普通人所说的“一本正经的胡说八道”。Open AI公司的CEO Sam Altman也曾经在接受采访时说过:“我最想提醒人们小心警惕的是ChatGPT的幻觉问题。”这是一个很严重的问题,目前还无法有效解决。

 

《纽约时报》今年5月27日报道,某律师在法庭诉讼当中引用了若干司法案例,该律师在前期文书准备工作当中使用了ChatGPT,但遗憾的是其中7个案例都是ChatGPT虚构的,在真实生活当中并不存在。这位律师不但输掉了官司,连今后能否继续执业都成了问题。特别有趣的是:这位律师在使用时还特意问了ChatGPT,能否保证列举的案例真实,他得到的回答是“是的”。在科研领域也发生过类似的问题,生成式AI编造了并不存在的科学引文文献。

 

幻觉问题产生的根本原因之一,就是训练数据的不完整、不准确、有偏见。在开放的互联网环境下训练大型语言模型(LLM),这一问题很难避免,互联网上充斥着错误和有偏见的信息。

 

但是,对科技和医学、法律这么关键的专业人士来说,“差不多”(good enough)就够了吗?

 

励讯集团的内容优势

励讯集团也在应用AI,但与大众使用的生成式AI产品不同之处,就在于其背后依靠的独特内容优势。


励讯集团在其四个业务领域多年来积累了海量的数据和内容,而且都是高质量、完整、可信赖的。比如在科技医学领域,期刊论文要经过同行评审,且有专业人员进行审核校准,其质量是互联网上庞杂的内容所无法比拟的。值得一提的是,这些数据和内容是我们经过几百年历史积累下来的,比如励讯集团旗下医学类旗舰期刊《柳叶刀》成立于1823年,今年是其创刊200周年。200年栉风沐雨,几代出版人和医学工作者共同打造,你怎能不信任这样的内容?

技术变迁与出版业发展

从印刷术发明以来,出版业最擅长的一件事就是策划、编辑、出版高质量和可信赖的内容。过去300年技术不断变化:电报、电话、广播、电视、互联网,从未让出版业消亡,人工智能也不会。

 

国际研究机构Gartner曾推出“人工智能技术成熟度曲线图”(其中hype是炒作的意思),截止到2023年7月份,生成式AI在这个曲线图当中的位置接近泡沫巅峰期。那么达到高峰之后,它的命运是什么?根据这个曲线图的走势,大概率会走下坡路,炒作终将过去。

过去这么多年以来,并不是所有炒作的技术概念都形成了大规模的商业应用。大家可以回顾一下,区块链、元宇宙、虚拟现实、增强现实等等,有多少变成了大规模商业应用?云计算可能是一个例外。专业人士判断,生成式AI将来也许会成为市场可普遍获得的一项技术,就像云计算一样,花钱就可以购买使用这项服务。

 

对于专业出版机构来说,AI时代还是内容为王。高质量、可信任的内容(数据)、对用户需求的深刻理解、先进的技术和平台、负责任的AI原则,将是专业出版的致胜关键。这也是励讯集团20年坚持不变的战略。我对专业出版的未来充满信心!

关于RX

励展博览集团(RX)是全球领先的展会活动主办机构,它将展会上的面对面商务交流与数据及数字产品相结合,旨在为个人、行业社群和企业建立业务,帮助客户在我们主办的跨越 43 个行业、22 个国家的 400 多场展会活动中了解市场信息、寻源产品和完成交易,从而提升面对面活动的影响力,赋能客户缔结数十亿美元收入,促进全球各地本地市场及国民经济的发展,同励百业,共展商机。RX 满怀热情对社会产生积极影响,并充分致力于为所有员工创造一个包容的工作环境。www.rxglobal.com

关于RXGC

励展博览集团大中华区(RXGC)历经 40 年的快速发展,是享誉中国的专业展览会主办机构,在中国拥有多家成员公司及合资企业,每年在中国主办约 70 场贸易展会,服务12 个专业领域并聚焦 7 个行业集群,包括汽车制造、电子制造、智能制造、礼品与零售、医疗与健康、印刷包装、餐饮与娱乐。与此同时,RXGC 全年还举办超过 100 场在线活动和运营数字工具,突破时空疆界,为行业社群提供 365 全天候产品曝光、商机建立、交易促成、洞见分享及知识学习的服务。www.rxglobal.com.cn