您可能已经看到科技界对生成人工智能的狂热,但猜猜谁对此有点低调?是的,苹果。但猜猜怎么了?最近有传言称,这家库比蒂诺科技巨头正在与谷歌商讨借用其GeminiAI来增强Siri的性能,并通过一些AI新技巧为iOS带来活力。现在,还有更多信息出现。
上周,苹果公司谨慎地发布了一篇研究论文(来自Wired),详细介绍了其在名为MM1的多模态大语言模型(MLLM)方面所做的努力,该模型可以同时处理文本和图像。报告显示MM1回答有关照片的问题,并展示了类似于ChatGPT等聊天机器人的广泛常识技能。虽然该型号的名称仍然是个谜,但MM1可能只是代表MultiModal1。
MM1似乎在设计和复杂性方面与其他科技巨头的最新人工智能模型有相似之处,例如谷歌的Gemini和Meta的开源Llama2。苹果竞争对手和学术界进行的研究表明,这种水平的模型可以推动熟练的聊天机器人或开发““代理”能够通过编码和采取行动(例如与计算机界面或网站交互)来执行任务。这暗示MM1最终可能成为苹果产品线的关键组成部分。苹果研究员、MM1论文的主要作者BrandonMcKinzie在X的帖子
中评论道:
这仅仅是个开始。该团队已经在努力开发下一代模型。非常感谢为这个项目做出贡献的所有人!
MM1是一种多模态大语言模型(MLLM),这意味着它同时接受图像和文本的训练。这种独特的训练使模型能够响应文本提示并解决有关特定图像的复杂问题。
在Apple研究论文的一个示例中,MM1获得了一张餐厅餐桌的图片,上面有啤酒和菜单。当提示“桌上所有啤酒”的预期成本时,该模型会准确识别价格并计算总费用。
苹果的iPhone已经配备了人工智能助手Siri。然而,随着ChatGPT等竞争对手的迅速崛起,Siri曾经具有开创性的功能开始感到受到限制和过时。亚马逊和谷歌都宣布计划将大语言模型(LLM)技术纳入各自的助手Alexa和GoogleAssistant中。谷歌甚至允许Android手机用户用Gemini替换Assistant。
随着三星和谷歌等竞争对手为其智能手机推出了大量生成式人工智能功能,苹果面临着保持竞争力的压力。苹果首席执行官蒂姆·库克向投资者保证,该公司今年将公布有关其生成式人工智能计划的更多细节。
更重要的是,就在最近,苹果收购了DarwinAI,这是一家加拿大人工智能初创公司,以开发紧凑高效的人工智能系统而闻名。所有这些都表明苹果正准备在人工智能领域大展拳脚,因此我们可以期待在不久的将来会有更多更新。敬请关注后续事态发展!
标签:
免责声明:本文由用户上传,如有侵权请联系删除!