《经济参考报》记者近日调研获悉,AI(人工智能)大模型相当于“超级大脑”,正成为人工智能“新高地”。AI大模型有望实现人工智能从感知到认知的跃迁,重新定义人工智能产业模式和产业标准,给部分产业带来重大变革。我国有较大的AI大模型应用市场,但发展过程中面临部分技术薄弱、人才稀缺、成本高昂等多重挑战,亟须对相关技术研发和产业布局加以引导和支持。
“学富五车”的“超级大脑”
——“不开心的话可以听点开心的歌,看看喜剧,也可以去运动,或者好好休息一下。”
——“心情不好是一种很正常的情绪,所以不用太过自责。”
针对“今天心情不好应该怎么办”这一问题,一个人工智能平台以不同的“人设”,给出了不同的回答。通过网址链接进入该平台,在“人设问答”区随机输入问题,机器可支持和扮演不同“人设”,对问题给出多角度答案。该平台正是基于AI大模型打造而成。
创新工场首席科学家、北京澜舟科技创始人周明介绍,AI大模型也称人工智能预训练模型,将海量数据导入具有几亿量级甚至十万亿量级参数的模型中,机器通过做类似“完形填空”等任务,深度学习数据中蕴含的特征、结构,最终被训练成具有逻辑推理和分析能力的人工智能。
通俗地说,AI大模型相当于做了无数套关于各领域知识练习题、模拟题的“超级大脑”,深谙各领域知识内在逻辑和解题思路,既能理解人类世界的知识体系,也可能产出新的知识。
2018年起,人工智能进入“大模型时代”,由重复开发、手工作坊式人工智能,即“一千个应用场景就有一千个小模型”的零散、低效局面,走向工业化、集成化智能的全新路径,以一个大模型“走天下”,为通用人工智能带来曙光。比如,为生产智能音响,各个品牌竞相开发各自的AI小模型,未来各品牌只需在同一个AI大模型基础上开发即可。
“以前是‘碎片化’的人工智能,针对不同的应用场景要开发不同的模型。作坊式开发对资源、成本造成较大消耗,且效率低下。未来在各垂直领域落地时,只需基于一个大模型,对其参数进行微调即可,这样就打造出了具有通用性质的人工智能。”华为云人工智能领域首席科学家、国际欧亚科学院院士田奇介绍,AI大模型将重新定义人工智能产业模式、产业标准,甚至产业伦理。
受访者举例介绍,以前的小模型就像“偏科的机器”,只学习针对特定应用场景的有限数据,“举一反三”能力不足,一些智能产品被用户调侃为“人工智障”的情况时有发生。而AI大模型则学习了各行各业各类数据,成为具备良好的知识迁移能力的“通才”,适用领域更广,产出内容质量更高,更加智能。
同时,周明指出,大模型的发展并非一味追求参数量大,而是聚焦模型的高性能,“在让大模型学习和掌握更大量数据的同时,尽可能让大模型参数相对轻量化,在‘减负’的同时提高能效。”
可分饰多角 应用场景广泛
自动问诊、产品营销、小说续写……由于懂得人类语言,且具备细分行业专业知识,一个AI大模型可分饰多角,它做得了医生,当得了作家,胜任得了情感博主,从事得了电商客服……
AI大模型行业适用范围广,在医疗、金融、零售、气象、新闻传播、文学艺术等领域具有广泛应用场景。周明介绍,在大模型中输入关键词、主题、文本风格等控制属性后,即可生成满足约束条件的文本内容,可用于产品营销文案写作、电商智能客服等。在金融等领域,大模型通过抓取行业数据,自主完成筛选、分析,并自主撰写生成行业报告,辅助从业人员做决策。
田奇介绍,AI大模型已应用于国网电力部门的日常线路检测。“以前要识别各种电力传输线上的缺陷,需要针对每一类缺陷单独做一个小模型,有几百种缺陷就要做几百种模型,现在利用一个大模型就可完成各类缺陷的识别。”
值得注意的是,AI大模型目前的技术进步,是人工智能从感知向认知演进的关键环节。清华大学计算机科学与技术系副教授刘知远表示,古今中外一切文章、资料,都可作为训练大模型的数据。通过分析并“内化”海量知识,不仅让智能产品拥有更高性能,如机器翻译更加准确、机器写作更加生动有逻辑;还能品读人类情感,用于情感标注。此外,“它可能识别到‘弦外之音’,甚至有希望发现人类未曾掌握的知识。”
这一技术的发展,也可能给部分产业带来重大变革。周明说,未来将产生新一代搜索引擎。“目前大部分搜索引擎是基于关键词识别,只将库里已有的包含关键词的结果‘搬运’给用户,而基于大模型的新一代搜索引擎,通过理解人类语言,可以自主生成回答,且支持文字、图片、音频、视频等多模态搜索。”
田奇表示,新一代搜索引擎具备创作能力,比如搜索“长翅膀的猫”“会飞的猪”等现实中不存在的事物,搜索引擎也可根据描述生成相应照片。
多重发展难题待解
当前,美国OpenAI、谷歌、微软、脸书、英伟达等海外公司纷纷布局AI大模型产业,国内的华为、阿里巴巴、百度等大型企业,以及高校、科研机构也加入研发赛道。AI大模型正成为人工智能“新高地”。
记者调研了解到,从技术上讲,国内AI大模型已初步成熟,下一步将聚焦行业推广,并结合具体问题对模型进行迭代。田奇预测,AI大模型的大规模应用“可能还需要两到三年时间”,且未来AI大模型还有望集纳于芯片上,更方便落地应用。
专家指出,我国有较大的AI大模型应用市场,在应用领域具有优势,但发展过程中也面临一些挑战。
刘知远介绍,很多核心技术目前仍然掌握在发达国家手中,训练AI大模型需大量GPU(图形处理器)芯片,但当前国产GPU芯片技术相对薄弱。同时,我国在算法上的原始创新能力也有待提升。
多位受访者表示,目前从事AI大模型研发且能产出创新性成果的高校、科研机构和企业屈指可数,与国外相比,我国相关领域高水平基础人才培养力度有待加强。
此外,训练大模型需要较高的电力成本、设备成本等,很多中小企业、科研单位囿于高昂成本,无法搭建拥有充足算力的机房,面临算力不足的问题。
多措并举抢占“新高地”
多位专家表示,AI大模型有望实现人工智能从感知到认知的跃迁,将更高效地赋能AI产业化和产业AI化。相关技术研发和产业布局引导、配套支持政策、合理监管等举措能否有效落地至关重要。
首先,推进AI大模型标准化。受访专家指出,大模型的训练过程具有高能耗的特点,制定标准后,许多工作可基于已经开发的标准化大模型进行适配和二次开发,无需每次从头训练,以降低能耗。同时,大模型发展的过程中,也可能衍生违法违规信息生成、隐私泄露、虚假信息传播等风险,对用于训练模型的源头数据等做好规范,有利于规避相关风险。国家相关部门可牵头或引导企业、研究所、高校等共同定义大模型的标准。
其次,适当开放训练数据。受访者表示,训练大模型需要海量数据,出于对数据的隐私、安全等方面的担忧,一些领域难以获取数据,形成数据孤岛。建议在国家机构监管和宏观把控的前提下,各方数据能够对白名单企业、机构、高校适当开放,在确保数据安全使用的同时,增强我国AI大模型实力。例如,医院等机构适当开放数据,将有利于训练更懂医疗的大模型,赋能健康医药领域发展。
再次,鼓励算力共享。记者调研了解到,目前只有部分大企业能够负担超大模型训练所需的算力成本。受访专家呼吁,可引导具有强算力的人工智能“国家队”,为更多中小微企业、科研单位提供大模型训练所需的算力支撑,可探索合理付费的算力共享机制,共同促进技术的发展和资源的节约。
最后,加大原始创新引导和支持。多位专家指出,我国应加强研发力度,同时加强针对模型框架的基础创新研究,引导更多科研单位、高校积极培养相关人才,鼓励更多社会力量加入这场信息革命的浪潮。