人工智能10大趋势 人工智能三大推动力:技术是源动力,应用是牵引力,安全是信任力 1)趋势一 统一未来:多模态模型加速文本、图像和视频融合 ✓ 多模态模型:多模态模型能够处理视觉信息、文本信息、听觉信息等多元化数据,可以对不同表现形式的信息进行融合理解,进一步提升大模型的迁移学习能力,是人工智能全面理解真实世界的重要一步。 ✓ 发展情况:文本、语音、图片等单模态人工智能模型已经相对成熟,大模型正在朝着多模态信息融合的方向快速发展。从CLIP的诞生再到GPT-4的图像处理能力,图文多模态技术已经取得了显著的进步。大模型不止满足文字和图像,开始向着音频、视频等领域拓展。 ✓ 未来展望:未来模型将面对更加复杂多样化的交互场景,更加注重各种形式的信息融合,多模态技术将在智能家居、智慧城市、医疗诊断、自动驾驶等方面打开全新的应用空间。 多模态模型迭代历程 2)趋势二 逾越虚拟边界:具身智能成为AI发展新形态 ✓ 具身智能:具身智能是可以和物理世界进行感知交互,并具有自主决策和行动能力的人工智能系统。具身智能中的智能体能够以主人公的视角感受物理世界,通过与环境产生交互并结合自我学习,从而产生对于客观世界的理解和改造能力。 ✓ 发展情况:斯坦福大学教授李飞飞将具身智能列为计算机视觉未来的关键发展方向,并将其称之为人工智能研究的“北极星”。现阶段来看,谷歌推出RoboCat大模型,英伟达推出Nvidia VIMA,具身智能已经成为AI龙头企业竞相争夺的高地。 ✓ 未来展望:通用人工智能与机器人产业正处在快速发展、互相融合促进的战略机遇期,作为两大领域交叉的核心应用,具身智能有望在未来取得快速发展。具身智能将促使智能体具备自主规划、决策、行动、执行等能力,实现人工智能的能力进阶。 人工智能能力进阶 3)趋势三 大模型智慧火花:走向通用人工智能的途径愈发明晰,脑机接口创造新的交互方式 ✓ 通用人工智能(AGI)是指具有像人类一样的思考能力,可以适应广泛的领域并解决多种问题的机器智能,AGI是人工智能研究的重要目标之一。狭义人工智能是指当下已取得显著进展但局限特定领域的人工智能,如语音识别、机器视觉等。我们正处于狭义人工智能相对成熟、通用人工智能曙光乍现的阶段,目前以GPT-4为代表的自然语言大模型被认为是通往通用人工智能的重要潜在路径,OpenAICEO萨姆·奥特曼(Sam Altman) 表示,AGI时代可能很快就会到来,未来十年内行业可能会拥有超强的AI系统。 ✓ 人类与人工智能之间的沟通方式也在不断升级,脑机接口有望成为下一代人机交互方式。当前,脑机接口技术正在突破人类的生理界限,不仅为残障人士提供了前所未有的可能性,而且有望成为下一代的人机交互方式。 4)趋势四 数据的力量:海量数据带来模型能力涌现,高质量数据提升模型性能 ✓ 深度学习的进步建立在以更大的模型处理海量数据基础之上。GPT-1模型从1.17亿参数上升至GPT-3的1750亿参数,模型效果取得了显著突破,同时还有能力的涌现。但是模型参数量的增大带来算力需求的激增,模型架构和参数量提升带来的收益正处于递减状态。 ✓ 阿伯丁大学、麻省理工大学等研究机构的一项研究显示,高质量的语言数据将在2026年耗尽,低质量的语言数据和图像数据将分别在2030 -2050年、2030 -2060年间枯竭。 ✓ 以数据为中心的人工智能更加专注于数据的价值,进一步推动AI模型的性能突破。斯坦福大学吴恩达教授提出二八定律:80%的数据+20%的模型=更好的AI。以数据为中心的策略可以解决数据样本不足、数据偏差等问题,高质量数据集成为推动模型性能进一步提升的关键要素,高质量的数据处理、数据标注服务以及完善的数据收集和评估体系的价值将进一步凸显。 |