阿布扎比人工智能和云计算公司G42旗下的公司Inception表示,阿联酋开发的大型语言模型Jais 70B的最新版本将能够以“前所未有的规模和规模”提供阿拉伯-英语双语功能。
盗梦空间将Jais 70B描述为一个700亿个参数模型。
在人工智能的上下文中,参数是一个变量,可以帮助提高LLM预测的准确性。
该公司表示:“它提高了处理复杂和微妙任务的能力,以及处理复杂数据集的更好能力。”
除了Jais 70B之外,盗梦空间还宣布将提供20种不同的模型,参数从5.9亿个到700亿个不等。
这个特殊的Jais版本部分基于来自阿拉伯语自然语言处理社区开发人员的反馈。根据Inception的说法,由于这种扩展,其中一个Jais模型是第一个以阿拉伯语为中心的LLM,小到可以在笔记本电脑上运行。
该公司还表示,Jais 70B的训练使用了“有史以来用于训练开源基础模型的最大阿拉伯语数据集”。
“创建Jais是为了保护阿拉伯遗产、文化和语言,并使人工智能的使用民主化,”盗梦空间首席执行官安德鲁•杰克逊(Andrew Jackson)表示。
“发布Jais 70B和这个新的家庭模型加强了我们为阿拉伯语国家提供最高质量的人工智能基础模型的承诺。”
Inception的首席应用科学家Neha Sengupta对Jais的最新性能测试进行了反思。
“对于多达300亿个参数的模型,我们成功地从头开始训练Jais,始终优于社区中的适应模型,”她说,并补充说,盗梦空间选择在meta的Llama 2开源LLM上构建Jais 70B。
“Jais 70B保留并在特定情况下超过了Llama2的高质量英语处理能力,同时在阿拉伯语输出方面远远优于基本型号,”她补充说。
法学硕士的名字Jais指的是阿联酋在Ras Al Khaimah的最高峰。
虽然阿拉伯语是世界上使用最广泛的语言之一,大约有4亿人使用,但在人工智能发展和大型语言模型的最初发展阶段,它并不是人工智能产品的前沿,英语被证明是最普遍的。
阿拉伯语方言的复杂性和多样性,加上各种语言的细微差别,也给试图完善机器学习技术的工程师和程序员带来了挑战。
然而,随着各种阿拉伯法学硕士(包括Jais)的引入,以及阿拉伯语的其他进步和努力,这种趋势在去年发生了转变。
阿联酋对阿拉伯人工智能和法学硕士的努力并不陌生。
早在今年5月,G42旗下的Core42就推出了一款阿拉伯语和英语双语聊天机器人Jais Chat。
该应用程序可以在iPhone设备上免费下载,精通阿拉伯语和英语。根据Core42的说法,该应用程序采用了以阿拉伯语为中心的模型,用于有效处理阿拉伯语文本。
就像OpenAI的ChatGPT或微软的CoPilot一样,用户可以使用Jais Chat上的各种提示来获得答案、收集信息并找到解决方案,这可能是传统搜索引擎无法做到的。
2023年,作为Core42和穆罕默德·本·扎耶德人工智能大学合作伙伴关系的一部分,阿联酋开发了一个致力于气候研究的双语法学硕士——Jais climate。
该双语模型包括140万条与气候相关的指令,并接受了有关气候和可持续发展相关主题的最大双语数据集的培训。
阿联酋的目标是成为全球人工智能领导者,并继续利用新时代技术,为未来的经济和社会做准备。
阿联酋因其成为全球人工智能中心的潜力而吸引了人们的兴趣,并已转向与西方科技巨头的合作关系。
与此同时,G42一直处于阿联酋人工智能增长战略的最前沿。
今年4月,它从微软获得了15亿美元的投资,这将有助于进一步推动G42的全球扩张计划,并加强阿联酋作为全球技术中心的地位。
去年10月,G42推出了一个新实体Core42,合并了三个关键部门——G42 Cloud、研发部门Inception和ICT部门Injazat,专注于在全国范围内提供人工智能解决方案和服务。
它还宣布与OpenAI建立合作伙伴关系,重点是在G42运营的垂直领域使用其模型,包括金融服务、能源、医疗保健和公共服务。