人工智能不仅仅是用来纠正你的语法或编辑照片的工具。
人工智能不仅仅是用来在ChatGPT上纠正你的语法或将你的照片变成吉卜力风格的艺术作品。它正在以更有意义的方式重塑世界,今年从阿布扎比的穆罕默德·本·扎耶德人工智能大学(MBZUAI)毕业的三位巴基斯坦女性就是这一转变的一部分。
由阿联酋政府资助的MBZUAI是世界上第一所专注于研究和研究生教育的人工智能大学。
三位来自巴基斯坦的女性在这里致力于使科学更加普及,并开发更智能的医疗工具——同时证明在正确的手中,人工智能可以做更多的事情,而不仅仅是自动补全你的句子。
有目的的人工智能
23岁的Tooba Tehreem Sheikh在2007年因晚期诊断失去了母亲,她的个人悲剧推动了她在人工智能领域的工作。Sheikh希望开发出能够在早期诊断出医疗问题的人工智能系统。“医生也是人,他们可能会错过很多东西,所以我想要开发出能够检测这些复杂、微妙问题的人工智能系统,这些问题常常被专家忽视。”她告诉《Images》杂志。
Sheikh获得了软件工程学位,并在巴基斯坦工作了一段时间后转向研究。她进入了MBZUAI攻读计算机视觉硕士学位。
她的工作重点是实时医学成像的人工智能系统,这些工具可以在资源有限的地方实现更快、更准确的诊断。她的贡献包括两个模型——IHA-YOLO,她描述为“轻量级、实时的细胞检测系统”;以及Med-YOLOWorld,“一种设计用于九种医学成像模式的开放词汇检测系统”。
由于这些系统是轻量级的,Sheikh解释说,它们可以在许多巴基斯坦医院已经拥有的设备上运行。不需要额外的高端计算资源。这使得它们不仅快速,而且在基础设施有限的情况下也易于访问和扩展。
这两个模型都接受医学图像——如CT扫描、X光片、MRI甚至结肠镜检查视频——并识别器官和可能的疾病。虽然IHA-YOLO在检测已知类别方面有效,但MedYOLO-World更进一步,识别出未经过明确训练的新颖异常。
类别可以看作是数据集中的特定类别。“比如说你有一个腹部CT图像。你有肝脏、胰腺和脾脏。这些都是类别。肝脏是一个类别。胰腺是一个类别。”Sheikh解释道。
但是将人工智能引入医疗保健并不意味着没有伦理挑战。Sheikh指出,一个主要问题是数据保密性。由于人工智能模型依赖大量患者数据,如果保护不当,它们可能会受到泄露的风险。“你需要确保不暴露患者的名字或患者的详细信息。”Sheikh说道。
她并不认为自己的工作是替代人类专业知识,而是辅助诊断的工具。Sheikh承认,巴基斯坦在医疗数字化方面仍落后,最终计划回国建立一家将人工智能整合到诊断护理中的医院。
打破语言障碍
27岁的Ashba Sameed是一名来自卡拉奇的人工智能研究员,她在MBZUAI的工作评估了人工智能如何更好地理解和连接口语和书面文本,使用音频和文本数据。
她测试了先进的AI模型(Spirit LM和Mini-Omni),执行诸如总结、回答问题和在多种语言(包括阿拉伯语和英语)之间进行语音和文本翻译的任务。Spirit LM对情感理解更为敏感,而Mini-Omni在基于指令的任务中表现更好。
Sameed学习了计算机系统工程,并在卡拉奇的人工智能研究中心工作时对人工智能产生了兴趣。在行业工作三年后,她前往MBZUAI从事自然语言处理的研究。
她的研究旨在改进机器如何遵循指令,无论是口语还是书面指令。这项研究对于巴基斯坦尤其有用,因为许多人讲地区语言,可能无法接触到基于文本的技术。
通过使基于语音的人工智能系统更智能和多语言化,她的工作可以帮助构建语音助手、自动化热线和翻译应用程序等工具,使其更容易为所有人使用,包括那些不流利使用英语或不能阅读的人。这可以改善全国范围内的教育、医疗保健和政府服务的获取。
Sameed强调了在训练人工智能模型时需要多样化的数据。“如果我使用来自阿联酋的数据,而我的目标受众是巴基斯坦,就会出现问题。”Sameed告诉《Images》。“因此,使用代表性数据非常重要。”
这样的AI技术在医疗、教育和政府服务中非常有用,特别是对于识字率低或数字技能有限的人群,Sameed指出。她说MBZUAI为她的未来奠定了基础,除了其他事情外,校园里的免费咖啡是她最怀念的。
教育普及
26岁的Fatimah Lyba Khan在拉合尔学习电气工程后,在MBZUAI从事自然语言处理研究。她构建了SciGrade,这是一个数据集和人工智能系统,可以简化五个教育水平和十个学科(包括生物学、化学、物理学、生态学和气象学)的复杂科学文本。
想象一下,它就像一座桥梁,连接着密集的科学术语和年轻学生,甚至是不太熟悉技术术语的成年人。
该工具使用大型语言模型(LLMs)简化适用于五个年级段的科学内容,从一年级到大学水平。Khan解释说,除了简化语言外,SciGrade还根据每个目标受众调整语气、词汇和句子结构,同时保持科学准确性。这是她必须解决的关键挑战——如何在简化的同时不损害内容。
为了确保科学内容的准确性,她说她为每个年级段设计了特定的提示,并在人工评估之前使用自动指标进行了测试。
虽然SciGrade目前仅支持英语,但Khan表示她希望将其功能扩展到其他语言,如阿拉伯语。在像巴基斯坦这样正规教育机会有限的国家,这样的工具可以帮助将技术信息转化为易于消化的内容。因此,它不仅适用于学龄儿童,也适用于任何好奇的学习者。
(全文结束)

