
1.1.2 大模型的全行业重塑
OpenAI与Meta等企业的竞争加速了大模型技术在各行各业的渗透和应用。各海外头部公司已经基于大模型技术发布了Microsoft 365 Copilot、New Bing、Dynamic 365 Copilot、BloombergGPT、Teladoc Health、Expedia等应用软件。大模型开始进入产业验证期,实现了办公、教育、搜索引擎、金融、医疗、酒店差旅等各类场景的应用,必然带来全行业的深刻变革。其颠覆性的变革主要体现在以下几个方面。
1.内容生产方式的变革
如图1.2所示,大模型和其他生成式AI将首先革新内容生产的方式,自动化许多复杂的创作过程。在体育新闻、格式合同等标准化内容的生产上,大模型基本上可以完全替代人工操作。而在美术、音乐等创意密集型领域,大模型可以降低专业门槛,使非专业人士也能够通过自然语言等交互方式创作高质量的作品。大模型等生成式AI的应用,不仅能极大提高内容生产的效率,快速生成或修改艺术作品,还能大幅缩短创作周期。

图1.2 内容生产方式的变革
尽管这些工具能够高效地生成大量内容,但人类的鉴赏能力仍然非常关键。这包括对艺术的审美判断、对信息的批判性思考、对内容的情感和文化敏感性等。在内容过剩的时代,筛选、解读和赋予内容深层意义的能力将变得更加重要。人类的鉴赏能力将成为评估和利用生成内容的关键。在大模型时代,人文素养和批判性思维将变得更为重要和稀缺。
2.科学研究方式的变革
科学的发现和创新通常建立在观察、建模、理论提出和实验验证的基础上。然而,现代科学的挑战之一在于如何从大量实验数据中提取有用信息,并将这些信息转化为知识。这一任务的复杂性往往超出了人类能力的范畴。在这一背景下,大模型的出现有望引领一场AI与科学结合的革命。大模型和其他人工智能技术正在增强人类对世界知识的获取和推理能力,极大地改变科学发现的方式。这些模型让复杂的推理过程不再受限于人类的经验和认知,而是能够探索超出传统思维范畴的领域。
目前,大模型已在多个科学领域得到应用,解决了一系列重大问题。如图1.3所示,它们被用于预测天气、预测蛋白质结构、设计和优化核聚变反应堆、自动化药物发现流程等,并且在识别复杂系统中的对称性和守恒律方面表现出类似科学家的能力。通过这些进展,大模型正在打开科学探索的新大门,使我们能够解决之前认为难以克服的科学难题。

图1.3 大模型在部分科学领域的应用
3.信息获取方式的变革
大模型正在改变人们获取和处理信息的方式。传统的信息检索需要用户通过搜索引擎输入关键词,然后在结果中筛选相关信息。而大模型可以直接理解复杂的查询,提供更准确、个性化的答案。这种变革使得信息获取过程更加直接和定制化,因为模型能够根据用户的具体问题,直接提供综合性答案而不需要用户从搜索结果中进行手动筛选。同时,大模型能从其庞大的训练数据中提取和整合信息,提供综合性答案。这意味着用户可以从单一的来源获取跨领域的综合信息,而不是从多个不同的来源手动整合。
大模型还带来了知识的民主化,可以毫不夸张地说,其历史地位可能比肩纸张、印刷机与互联网的发明。它通过易于理解的方式提供信息,包括解释复杂概念和回答具体问题,使得没有专业背景的普通用户也能够理解复杂的知识。这种普遍的信息可访问性为更广泛的人群提供了获取知识的机会,从而促进知识的民主化。
4.人机交互方式的变革
大模型的发展将为人机交互方式带来革命性的变化。传统的人机交互主要依赖命令行接口和图形用户界面,要求用户通过键入特定命令或使用鼠标进行点击、拖曳等操作来与计算机系统交互。而大模型,特别是多模态大模型,能够采用更加贴近人类的交互方式,例如通过自然语言的口语形式或通过表情和肢体动作识别用户意图。同时,多模态大模型可以作为智能代理理解复杂的任务请求,自动分解并执行相关的工作流程,从而实现更高效的任务处理。
这种转变意味着未来的人机交互将更加自然、直观和高效。用户不再需要学习特定的命令或适应图形用户界面的限制,而是可以使用最自然的方式(如说话、表情和动作)来与信息系统进行交流。这不仅提高了交互的便捷性,也极大地拓宽了人机交互的应用场景,特别是在教育、智能家居、个人助理等领域。此外,智能代理的自动化处理能力将大大提高工作效率,减少重复性劳动,使人们能更多地专注于创造性和策略性的任务。
5.智能硬件与智能化工作流的变革
现有的智能体,包括与硬件结合的机器人等具身智能,缺乏对其所解决的任务和环境的认知能力。智能体学到的策略即便在非常相似的任务中,也很难实现泛化。
大模型在处理和理解自然语言方面展现出强大的能力,可以认为其具备一定的世界知识,从而帮助智能体更好地理解复杂和模糊的任务与环境,在不同但相似的任务中做出更准确的决策。大模型还能够整合来自不同领域和场景的知识,这有助于智能体在面对新任务时应用已学到的策略。例如,一个经过训练而在特定环境中执行任务的机器人,在大模型的辅助下,能够更好地将其学到的策略应用到类似但不完全相同的新环境中。因此,大模型可以作为一个强大的决策支持工具,帮助智能体在难以泛化的情况下进行更好的判断。大模型能够提供与任务相关的附加信息或建议,从而提高智能体在新环境中的表现。
同时,多模态大模型能够处理和分析不同类型的数据(如视觉、语音、文本等),这有助于机器人更全面地理解其所处的环境。例如,机器人可以通过视觉信息识别物体,通过语音和文本理解人类指令,从而更有效地与物理世界互动。通过提供更丰富的环境信息和更精确的预测,多模态可以帮助机器人更好地适应复杂的物理交互。这对于需要精确操作和快速反应的自动化生产场景尤为重要。大模型推理成本的降低,使得在资源受限的环境(如边缘计算设备)中部署大模型变得可行。这意味着机器人可以在本地进行更复杂的数据处理和决策,减少对云计算资源的依赖,从而降低模型推理的延迟,解决计算复杂性问题,这将极大地推动机器人等具身智能的应用。例如,图1.4所示的特斯拉人形机器人设计使其更容易适应人类的工作环境,执行更多种类的任务,对自动化生产和家居等领域的应用具有深远的影响。

图1.4 特斯拉人形机器人