TikTok 引入蒋路发力 AI 视频生成

TikTok吸纳前谷歌VideoPoet项目负责人蒋路,加大AI视频生成力度

字节跳动是否能参与OpenAI与谷歌的AI竞争?这是一个值得关注的问题。据「甲子光年」独家消息,谷歌高级科学家、卡内基梅隆大学(CMU)计算机学院兼职教授蒋路已正式加入TikTok。蒋路曾是谷歌VideoPoet项目的负责人,该项目是谷歌在2023年12月推出的视频生成大模型,与OpenAI最近发布的Sora有许多相似之处。

近期,昆仑万维创始人周亚辉在社交圈中透露,一位论文作者已加入字节跳动北美团队担任技术领导,这位作者正是《VideoPoet: A large language model for zero-shot video generation》论文的作者蒋路。

蒋路在西安交通大学、布鲁塞尔自由大学、卡内基梅隆大学接受了计算机教育,并在微软亚洲研究院、谷歌研究院、雅虎研究院进行了实习。2017年,蒋路毕业后加入谷歌,成为谷歌云AI的创始成员,也是李佳博士和李飞飞博士首次聘请的研究员。此后,蒋路进入谷歌研究院工作。

蒋路的研究成果已被应用到谷歌的多个产品中,如YouTube、云服务、云AutoML、广告、Waymo和翻译服务,影响了全球数十亿用户的日常生活。

蒋路的工作在自然语言处理(ACL)和计算机视觉(CVPR)的顶级会议上被提名为最佳论文。他是研究社区的活跃成员,担任美国国家种子基金(NSF SBIR)的AI评审专家,并定期担任CVPR、ICCV、NeurlPS、ACM Multimedia和AAAI等著名会议的领域主席。

蒋路的研究兴趣主要在多媒体交叉领域,他专注于生成式AI和视频创作。2019年起,他就开始尝试将Transformer用在图像、视频生成研究上。与Sora采用的Diffusion + Transformer架构不同,蒋路负责的VideoPoet视频生成模型采用了单Transformer架构,可以将任何自回归语言模型或大型语言模型转换为高质量的视频生成器,支持生成方形或纵向视频,以针对短格式内容定制生成视频,并支持视频输入生成音频。

三周前,蒋路在职场社交平台上宣布了自己在谷歌的最后一天,并特别表示对在谷歌所做的视频生成项目(VideoPoet,MAGVIT,WALT等)感到自豪。蒋路表示自己将继续留在湾区,开始视频生成领域的新旅程。现在来看,新的旅程就是TikTok。

值得一提的是,字节跳动已经在大模型领域全面布局,模型层推出了自研的「云雀大模型」以及类ChatGPT对话机器人产品豆包。2023年底,字节跳动成立新的AI应用部门Flow,并在海外推出了Coze等多款产品。抖音集团CEO张楠也于近期卸任,专注于AI工具剪映的发展。

字节跳动近期辟谣了推出中文版Sora,并表示:"还无法完善产品落地,距离国外模型有很大差距。"但另一方面,字节跳动正在大力招揽人才。


知名企业

张一鸣 阿尔特曼的最佳盟友

相关百科

最新百科

最热百科

上一篇

返回电商百科
欧盟调查 TikTok