跳至主要内容
2 分钟阅读 AI 代理

Andrew Ng 探索 AI 代理和代理推理的发展 |

在 BUILD 2024 上与 Andrew Ng 一起探索 AI 代理和代理工作流程趋势,其新概念“快速行动并负责”正在快速、负责任地改变 AI 格局。

ภาพชั้นต่าง ๆ ของ AI stack

AI 正在迅速改变世界,著名 AI 专家之一 Andrew Ng 在 构建 2024 他强调了 AI 代理和代理推理技术带来的新机会,它们是开发功能强大且具有成本效益的 AI 应用程序的新方法。

AI 是数字时代的电力。

Andrew Ng 将 AI 比作“新时代的电力”,因为它是一项有用的技术,涵盖了过去的电力等许多方面。AI 是一种基础技术,从半导体等硬件到 Snowflake 等基于云的基础设施,再到最近受到广泛关注的基础模型层,多层相互堆叠。

ภาพชั้นต่าง ๆ ของ AI stack

然而,重要且经常被忽视的是应用层,它将为下面的技术创造价值和收入。因此,AI 应用的开发是创造新创新的最大机会的领域。

使用生成式 AI 加快 AI 开发速度

过去几年的一个显著趋势是开发速度更快的 AI 模型。 生成式 AI 这允许在更短的时间内创建应用程序。

例如,创建一个用于检查文本中的情绪的情绪分类器。而不是数月的数据准备、训练模型和实施。目前,只需编写正确的提示并立即部署,即可在短短几天内完成此作。

การพัฒนา sentiment classifier ที่รวดเร็วขึ้นด้วย generative AI

这种快速发展使 AI 团队有机会在短时间内试验大规模原型设计,例如在周末创建 20 个原型,然后只选择效果最好的原型。这是从长期提前规划到快速实验和改进的思维转变。

新挑战:评估和应用程序开发

尽管模型训练要快得多,但评估(也称为评估)已成为一个主要瓶颈,因为在使用大型语言模型 (LLM) 的应用程序中,有时不需要大量的训练数据。但它需要大量的测试数据来确保准确性和可靠性。

因此,重新开发的过程变成了并行创建和存储数据。而不是遵循相同的顺序。此外,应用程序创建还有很多阶段,例如产品设计、集成和部署后护理,这些阶段不如 AI 模型开发快。

模型训练速度的加快迫使组织加快其他领域的开发,以实现 AI 的有效商业使用。

新理念:“行动迅速,勇于担当”

过去,有一个口号“Move fast and break things”,强调即使可能发生错误也要加速实验,但这个口号因其造成负面后果而受到负面评价。然而,Andrew Ng 认为,在这个时代,正确的想法是” 快速行动,勇于担当 “这是一个快速的发展,但必须考虑到责任。请勿发布可能对公众造成损害的物品。

智能 AI 开发团队可以在将其发布到生产环境之前快速安全地进行原型设计、审查和全面测试,这令人兴奋并极大地改变了 AI 行业。

值得关注的技术:代理 AI 工作流

Andrew Ng 最感兴趣的趋势之一是” 代理 AI 或者 AI 设计,以多个步骤运行代理和推理过程(代理工作流),这与使用称为“代理”的传统大型语言模型不同。 零样本提示

零样本提示 我们只需命令模型一次性回答问题或编写内容,例如从头到尾写一篇文章,而无需在此过程中进行编辑。

เปรียบเทียบ zero-shot prompting กับ agentic workflows

另一方面,代理工作流程分阶段进行,例如从绘图草图开始,研究更多信息,修改原始草稿,并多次重复这些步骤,直到获得更高质量的结果。

代理 AI 应用程序的示例包括分析复杂的法律文件。这可以大大提高效率和准确性。

代理工作流有 4 个主要设计原则。

  1. 反射 :让模型审查和批评自己的工作,例如编写代码,然后让模型检查错误并更好地修复它。
  2. 使用 :让模型决定运行 API 或其他功能,例如 Web 搜索、发送电子邮件或管理预约计划。
  3. 规划 :让模型规划一个工作流序列,例如通过分离先检测手势、创建图像、描述图像、最后创建音效的步骤来创建图像。
  4. 多代理协作 :提供模拟多个角色(例如编码员和评论家)的模型,协同工作以减少错误并提高工作质量。
ตัวอย่าง reflection design pattern ใน agentic workflows

这些模式使开发人员能够快速构建更复杂、更高效的系统。

大型多模态模型 (LMM) 和视觉 AI 的出现

除了大的语言模型之外,开发支持多种数据格式(如图像、视频和音频,也称为 大型多模态模型 (LMM) 这是一个值得关注的趋势。

这些模型可以在使用代理工作流时更好地处理视觉和视频数据,例如从照片中计算足球场上的球员数量,或提取里程碑的视频剪辑,例如在足球比赛中进球。

นับจำนวนผู้เล่นในสนามฟุตบอลด้วย visual AI agent

Andrew Ng 和 Landing AI 团队演示的一个演示示例是使用视觉代理自动编写图像和视频分析代码,使拥有大量图像和视频数据的公司更容易使用这些数据。

ตัวอย่างการวิเคราะห์คลิปวิดีโอหาช่วงเวลาการทำประตู

还可以从视频创建元数据,例如将剪辑分成短片段,并以表格格式提供旁白和数据,以便进一步搜索和分析。

โค้ดสำหรับจัดการข้อมูลวิดีโอและเมตาดาต้า

代理 AI 在商业中的好处和机会

借助代理 AI 和视觉 AI 的功能,拥有文本、图像和视频等非结构化数据的企业可以创造更多价值。

例如,搜索包含特定事件的视频剪辑。以前,跟踪视频中的对象或分析不同环境中的图像既困难又耗时。

การค้นหาคลิปวิดีโอตามคำค้นหาเฉพาะ

此外,创建这些应用程序要容易得多,也更快捷。这使得小团队无需高额投资即可进行创新。

值得关注的 AI 主要趋势概述

Andrew Ng 概述了推动 AI 向前发展的四个关键趋势:

  1. Token 创建加速 因为代理工作流必须读取并生成大量文本。这导致了硬件和软件技术的发展以提高效率。
  2. 为生产训练的大型语言模型(以供使用) 不仅仅是回答一个一般性的问题,例如 Anthropic,它推出了一个支持使用真实计算机的模型。
  3. 使用非结构化数据进行数据工程的重要性 例如,文本、图像和视频的数量正在增加,必须对其进行有效管理才能创造价值。
  4. 图像处理革命即将到来。 尽管文本处理已经很普遍,但图像处理正处于起步阶段,将创造许多新的机会。
สรุปเทรนด์สำคัญของ AI

来自 Insiderly 的结论

这是 AI 开发人员比以往任何时候都更快地进行试验和创新的绝佳机会,生成式 AI 可以缩短开发时间,而代理式 AI 可以扩展模型功能的范围,使其更加复杂和灵活。大型多模态模型的出现使我们能够更有效地管理图像和视频数据。

开发代理工作流不仅可以提高 AI 工作的质量,还可以将系统设计的思维方式转变为不断规划、分析和改进的过程,这是在瞬息万变的 AI 世界中取得成功的关键。

最后非结构化数据管理和创建快速、负责任的应用程序将成为希望使用 AI 创造真正价值和实现业务转型的组织的核心。

适合有兴趣尝试的人。 可视化 AI 演示 由 Andrew Ng 和 Landing AI 团队创建。您可以访问 va.landing.ai 以试用并立即查看代码示例。

您应该了解的技术术语