基调: 用于泰文文档 OCR 的生成式 AI
事件: SCBX 解锁 AI EP4,计算机视觉:AI 如何像我们一样看待事物
协作: SCBX 系列 和 Insiderly.ai
场地: SCBX NextTech,暹罗百丽宫,4 楼
议长: Dr. Kobkrit Wiriyayuthakorn, 总裁, 艾伊特 以及公司首席执行官。 iApp 技术
很少有人喜欢做文书工作,因为这是一项复杂、复杂的任务,本身并不能加强新技能,但许多人应该很高兴知道,使用生成式人工智能使过去无聊的文书工作变得无聊。它可以在短时间内完成,然后转到其他更有用的任务。

AIEAT 总裁 Kobkrit Wiriyayuthakorn 博士在研讨会“SCBX UNLOCKING AI:EP4 计算机视觉:AI 如何像我们一样看待事物”中简要谈到了泰国文档 OCR 的生成式 AI 主题,这种文档技术称为 OCR,代表光学字符识别,这是将数据(无论是图像还是文本)以模拟格式转换为有序排列的数字信息的过程。
Kobkrit 博士他解释说,在泰国,自 2018 年以来,我们很长一段时间都能够使用 AI 来帮助解压缩文件数据,尤其是通过物体检测来解压身份证上的数据,或者将大块数据切成小块,然后以结构化的方式排列数据,以了解哪些部分是哪些。


但在未来,我们将不再需要对象检测,因为我们可以使用像 GPT 这样的智能来提取原始 OCR 文本并将其自动排序为结构化数据。
不使用对象检测的另一个优点是,我们可以支持没有固定模板的文档,例如各种格式的收据,使泰语文档 OCR 变得灵活,能够立即接收新文档。
OCR 的优势在于它可以帮助工作人员管理公函、报价单、收据和发票等文件中的信息,这些文件可以快速有序地排列成漂亮的结构。无需浪费时间逐个输入数据,一次一个输入数据直到最后。




但是,有一个缺点,即当前的 GPT4 系统处理数据仍然非常缓慢。特别是如果数据是用泰语输入的。平均而言,处理需要 60-90 秒,这在表面上似乎很短,但如果您必须处理 100 多张板材,则意味着成本会随之增加。
好消息是,在泰国,泰国自己的生成式 AI 正在开发中,名为 OpenThaiGPT,这是一种收集泰国知识的 AI,并拥有来自 Pantip 网站的重要数据库。




最近,开发团队尝试参加 6 年级的 ONET 考试,并获得高于泰国儿童平均分的分数。不仅如此,OpenThaiGpt 还擅长英语。不仅擅长泰语。

然而Kobkrit 博士诚然,从整体上看,我们的 Open AI 可能无法与农村地区的 AI 竞争,但这是一个好的愿景,这将是帮助泰国人比以前更好地工作的重要一步,到今年年底,OpenThaiGPT 70b 版本也将发布,它将智能很多倍。
