【亿邦原创】本周AI新品依然值得期待。
Meta将在本周三LlamaCon开发者大会上,正式推出社交类AI产品,对标ChatGPT,联动AI眼镜,还加入了一个名为“发现(Discover)”的信息流。
Google系爆款应用NotebookLM更新,本来想做个AI笔记产品,结果变成最受欢迎的生成式播客,还练成了地道北京话。
首个AI科学家天团出道,由四个科学家型AI Agent组成,科研能力直接超越o3,文献搜索已经超过人类博士。
百度公布动物语言转换专利,可实现与动物深度交流,你想听懂你的猫在骂骂咧咧些什么吗?更早前,还有AI产品能读懂植物“语言”。
尽管大模型应用市场欣欣向荣,但技术狂飙的另一面是监管难题。MIT教授发出示警:在这场通往AGI的竞赛中,人类或许正在逐渐走向失控。MIT最新研究指出:即使采用最理想的监督机制,人类成功控制超级智能的概率也仅为52%,而全面失控的风险可能超过90%。
1、OpenAI暂停向营利性机构转型
5月6日凌晨两点,OpenAI宣布暂停由非营利性转变成营利性公司的计划,并引入公共利益公司(Public Benefit Corporation,简称PBC)控制模式。
OpenAI宣布,它将继续由非营利组织控制;现有的营利性实体将转变为一家公共利益公司;非营利组织将控制该公共利益公司,并成为其重要的持股方。
这一举措可能会使OpenAI未来的融资计划变得复杂。与传统董事会必须以股东利益为重不同,OpenAI的非营利董事会负有“造福全人类”的信托责任。
奥特曼在新闻发布会上表示,新计划建立了更明晰的治理架构,“这种调整可能没有外界预期的那么激进”。他还表示,“OpenAI并非一家普通的公司,也永远不会是。我们的使命是确保通用人工智能(AGI)造福全人类。”在过去一年的融资过程中,OpenAI一直以即将转型为更传统的公司结构作为吸引投资者的承诺。部分投资者的融资条款要求OpenAI必须成功完成重组,才能获得全部资金。
2、Meta推出独立AI应用:指向AI社交方向
Meta将在本周三LlamaCon开发者大会上正式推出一款独立的AI应用。用户可通过这款应用直接访问Meta AI,类似于ChatGPT应用和其他AI助手类工具。Meta表示,这款AI应用可通过“主动分享的信息”实现个性化服务,例如你的个人资料,以及你点赞、评论或转发的内容。目前,这些个性化回应功能已在美国和加拿大上线。
这款AI应用还加入了一个名为“发现(Discover)”的信息流,用户可以在这里展示他们如何使用AI。例如一位用户让AI用三个表情符号描述自己,然后将这个结果分享给朋友。需要说明的是,只有在用户主动选择分享的前提下,这些互动内容才会出现在Discover动态中。
3、Google系爆款应用NotebookLM更新,练成地道北京话
Google系的爆款应用NotebookLM更新,支持多达五十种语言来生成播客——包括中文。
NotebookLM是Google推出的AI笔记产品,但最受关注的功能是:可以将你上传的任何内容,生成一个对话式播客——聊着聊着就能把晦涩的知识点听进去,且几乎没有传统文本转声音的AI味。
4、首个AI科学家天团出道
5月2日,FutureHouse发布了四个AI科学家Agent,分别是:
通用智能体:Crow(乌鸦)
自动化文献综述智能体:Falcon(猎鹰)
调研智能体:Owl(猫头鹰)
实验智能体:Phoenix(凤凰)
FutureHouse是前谷歌CEO Eric Schmidt投资的一家非营利组织。Future House宣布,Agent科学家的科研能力直接超越o3,文献搜索已经超过人类博士。Crow、Falcon和Owl通过了严格的基准测试,在搜索精度和准确性上已经超越了目前顶级搜索模型,比如o3-mini,GPT-4.5,Claude-3.7。FutureHouse还通过实验,验证了它们在直接文献搜索任务中,检索和综合能力比博士水平的研究人员具有更高的精度。
FutureHouse会为用户提供一个API,允许研究者将这些智能体直接集成到他们的工作流中。目前这些智能体还不能自主完成大多数的科学研究。Future House内部还有专门用于数据分析、假设生成、蛋白质工程等方面的智能体,未来几个月内即将上线。
5、梁文锋和杨植麟再“撞车”,同时进军另一大模型赛道
继2月论文“撞车”之后,梁文锋和杨植麟又在另一个大模型赛道上相遇了。
4月30日,DeepSeek上线新模型DeepSeek-Prover-V2,这是一个数学定理证明专用模型。Prover-V2的参数规模进一步扩展到671B(6710亿规模参数),相较于前一代V1.5版本的7B规模增加了近百倍,这让其在数学测试集上的效率和正确率更高。
巧合的是,4月中旬,月之暗面也曾推出一款用于形式化定理证明的大模型Kimina-Prover,这是Kimi团队和Numina共同研发的大模型,该产品也开源了1.5B和7B参数的模型蒸馏版本。该模型的miniF2F测试通过率为80.7%,PutnamBench测试成绩为10道题。
两者相比较,在miniF2F测试通过率以及普特南测试上,DeepSeek-Prover-V2的表现超过了Kimina-Prover预览版。值得注意的是,两家公司在技术报告中都提到了强化学习。比如DeepSeek的题目为《DeepSeek-Prover-V2:通过子目标分解的强化学习推进形式数学推理》,而月之暗面的题目为《Kimina-Prover Preview:基于强化学习技术的大型形式推理模型》。
6、阿里通义应用视觉团队负责人薄列峰离职
5月6日,据知情人士透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级P10)已于4月30日低调离职。此前他曾带领团队开发出通义App上的“兵马俑跳科目三”等爆款功能。有消息称他已经加入刚刚进行架构调整的某互联网大厂,担任多模态模型部副总经理,向公司副总裁汇报。
2022年9月,薄列峰加入阿里,接替离职的谭平,担任达摩院XR实验室(X Lab)负责人。此后,薄列峰转岗至阿里通义实验室,担任应用视觉团队负责人,成为阿里通义大模型图像和多模态方向的领军人物。
7、能和动物深度说话,百度公布动物语言转换专利
5月6日,百度公布动物语言转换专利,可实现与动物深度交流。据公开资料显示,北京百度网讯科技有限公司申请的“动物语言转换方法、装置、电子设备及存储介质”专利正式公布。该专利涉及人工智能技术领域,涵盖机器学习、深度学习和自然语言处理等技术。据介绍,这一专利能够准确识别动物的情感状态,并将其转换为人类能够理解的语言,从而实现动物与人类之间更深层次的情感交流和理解。也就是说它不仅提高了跨物种沟通的准确性和效率,还能为未来人与动物深度交流提供新的可能性。
8、MIT教授示警:AGI失控率>90%
近日,MIT教授Max Tegmark和Joshua Engels通过量化分析得出一个结论,较弱的AI和人类能够通过嵌套“可扩展监督”(Nested Scalable Oversight,NSO)来控制更强大的AI。
“可扩展监督”研究的是能力不匹配的玩家之间的博弈,即弱人工智能系统监督强人工智能系统的过程,这被视为控制未来超级智能系统的一种关键策略。
Max Tegmark表示,“在最佳场景下,我们成功监督更强AI的概率为52%,但随着接近AGI(通用人工智能),成功率下降。我的评估是,‘康普顿常数’——即AGI竞赛导致地球失控的概率——超过90%。”
马克斯·泰格马克(Max Tegmark)宇宙学家,现任麻省理工学院教授,基础问题研究所科学主任。曾经马克斯是一名物理学家,在他看到人工智能的强大后,便致力于将基础科学与人工智能结合,发展出可以用基础科学方法“理解”的人工智能。
文章来源:亿邦动力