跳至主要内容
2 分钟阅读 SCBX 解锁 AI

从 SCBX UNLOCKING AI 研讨会 (EP4) 探索计算机视觉世界总结

สรุปเนื้อหา เรื่อง Exploring the world of Computer Vision จากงานสัมมนา SCBX UNLOCKING AI (EP4)

基调: 探索计算机视觉的世界

事件: SCBX 解锁 AI EP4,计算机视觉:AI 如何像我们一样看待事物

协作: SCBX 系列 Insiderly.ai

场地: SCBX NextTech,暹罗百丽宫,4 楼

演讲者:Samprit Marukthatat 博士 高级研究员 NECTEC 公司

ดร.สรรพฤทธิ์ มฤคทัต Senior Researcher, NECTEC
ดร.สรรพฤทธิ์ มฤคทัต NECTEC 高级研究员

随着技术的进步,计算机和所谓的计算机视觉的力量变得越来越广泛,使任何人都可以更轻松地在广阔的世界中导航。

在题为“计算机视觉:AI 如何像我们一样看待事物”的研讨会“SCBX UNLOCKING AI:EP4”中,NECTEC 高级研究员 Samprit Maruktat 博士以“探索计算机视觉的世界”为主题,解释了这种尖端的 AI 技术如何帮助改善人们的生活。关键点如下:

  1. 如果您想知道计算机视觉可以用于哪些领域?最简单的方法是看好莱坞电影,比如《铁幕》电影《终结者》,其中智能机器人配备了全方位的高科技,其中之一是看到事物并检测它们并将其加工成图像,或者在电影《鹰眼》中,人工智能试图读取人们的嘴巴,看看他们在说什么。
  1. 计算机视觉可以立即让我们的生活更轻松的一件事是帮助我们以各种形式查找信息,例如搜索照片。只需使用多种类型的生成式 AI 和许多支持无版权图像的平台即可。

这些电影中有什么?在过去,这可能被视为不切实际。但现在它是真实的或可能成为现实,不仅在这两部电影中它通过概念描绘了尖端技术的使用,而且电影中还有许多其他技术已经成为现实。不过,根据叙事风格,这可能还不是一个可以被广泛使用的突破口。

  1. 更深层次的计算机视觉正在许多领域得到应用,例如医学,它使用 AI 来提高图像质量以帮助医生更准确地诊断 X 射线图像,以及使用 AI 来检测物体,例如检测腹部肿瘤。3D 识别建模、语音识别等
  2. Sampharit 博士解释计算机世界观的原理:计算机将世界视为像素。它看起来像一个小方块,彼此重叠以形成一个大图像。
  3. 使用计算机视觉的第一项工作是设计,通过编写代码来组装像素级的小东西。计算机视觉起源于一个没有 AI 这个词的时代。
  4. 神经网络现在正用于计算机视觉,以帮助从构成图像的像素中自动提取特征。
  1. 但即使它今天可以以多种方式使用。计算机视觉的挑战并不少。如果您需要在短时间内创建大量图像并创建一致的标题,您如何控制质量?

目前,可以创建可以同时处理图像和文本的 AI,例如从字幕生成图像的 Stable Diffusion、为图像生成字幕的图像字幕系统、可以回答与图像相关的问题的视觉问答系统,以及有助于查看图像和字幕之间一致性的 OpenAI 的 CLIP 系统。

Visual Questions Answering เป็นตัวอย่างการใช้งาน Computer Vision ที่น่าสนใจ
Visual Questions Answering 是使用计算机视觉的一个有趣示例。

在医学领域,例如肺 X 射线分析,也应用了相同的原理。该系统,即用于创建适用于诊断成像的特征的神经网络,例如正常人或 COVID-19 患者的肺部 X 光检查,或从血玻片图像中进行地中海贫血分析,也使用深度神经网络。

这些神经网络创建的特征可能无法直接解释为文字。因此,普通医生不接受这些神经网络的诊断。


如今,有很多医生在做自己的人工智能研究,在医学研究会议上关于这个主题的研究会议要多得多。与 5-6 年前相比,这是一个重要的机制,导致越来越多的人接受神经网络的诊断。

  1. 开发人员面临的另一个挑战是访问具有有限数据的数据,这使得研究人员和工作人员无法开发高质量的工作。因为通常那些拥有信息的人不允许使用它或继续开发它。因此,工作质量不如预期。
  2. 此外,擅长泰语的 AI 很少。与发达的外国模型相比,这将导致上述基本挑战,甚至更多。