
草根影响力新视野(琪拉编译)
过去两年,Sawant先生一直骑著摩托车在孟买街头穿梭,担任送货司机。但刚开始工作时,语言障碍又成了问题。他的母语是马拉地语,而 Sawant 先生的英语却很不好。 “我能听懂,但读起来很费劲。”他解释道,这给他的新工作带来很多麻烦。他的雇主 Zepto 承诺提供“印度最快的在线杂货配送服务”。因此,让驾驶费力地理解配送指示并非理想之选。为了简化这项流程,Zepto 一年前与 Reverie Language Technologies公司 合作,为其司机推出了一项人工智能翻译服务。自此以后,Zepto 的送货司机可以在六种语言之间进行选择。
Sawant 先生面临的困难很普遍,因为印度有 22 种官方语言和数百种方言,印度理工学院孟买分校的 Pushpak Bhattacharyya 教授说道,他是印度语言人工智能应用领域的顶尖专家之一。“如果没有能够理解和使用这些语言的技术,数百万人将被排除在数码革命之外,尤其是在教育、政府治理、医疗保健和银行业。”他指出。ChatGPT 等新型生成式人工智能系统的推出,使得这项任务更加迫切。
对于印地语和英语等广泛使用的语言来说,这些数据相对容易获取,但对于其他语言来说,则更加困难。“创建印度语言模型的主要挑战在于数据的可用性,普通数据容易获得,但这些数据质量不高,需要过滤。印度的问题在于,对于许多印度语言,特别是部落和地区方言来说,这些数据根本不存在或没有数码化。”Bhattacharyya 教授说。
图片取自:(示意图123rf)
Reverie Language Technologies 目前正在为一系打印度公司部署其人工智能翻译技术。联合创始人 Vivekananda Pani 表示,虽然翻译技术将使沟通更加便捷,但“可能会取代一些不太常见的方言”。
为了解决这个问题,印度政府建构了 Bhashini计划,希望能开发训练人工智能所需的高品质资料集。这些资料集完全为了因应印度特殊的文化与语言需要而产生,希望这些以印度为中心的资料集有朝一日能为开发人工智能模型的人提供工具,使其更容易适应全民需求。
目前Bhashini希望最终能够以 22 种语言完成。成效似乎不错,Sawant现在 每天派送的包裹数量从 10 个增加到 30 个左右,得益于配送应用程序中的翻译功能。
他认为这将帮助更多像他这样的人。他说,这个工具让他有归属感,因为印度不是每个人都懂英语,但当应用程序能识别我们的语言时,我们会更有信心,工作效率也会更高。