广告
加载中

12家创业公司+4家大厂全景图:谁会成为中国版Sora?

赵健 2024/02/27 13:17

一年前,ChatGPT的爆火很快在大语言模型领域催生了“百模大战”。一年后,Sora横空出世再次惊艳世人,这一次是否会掀起新一轮的AI视频领域的百模大战?

近期,DiT(Diffusion Transformer)论文的作者谢赛宁在朋友圈分享了他对Sora的看法,其中核心资源的排序是——人才第一、数据第二、算力第三,其他都没有什么是不可替代的。

国内有哪些团队、哪些人才正在从事AI视频行业?

为此,「甲子光年」基于公开资料与现有信息,整理了国内12家创业公司与4 家大厂的AI视频团队信息。

这些信息不仅给产品爱好者较为全面的AI生成视频模型总结,也给更多的关注人工智能技术走向的AI从业者们一份技术与人才指南。

(以下公司按公司名首字母排序,欢迎补充。)

12家创业公司:产品、落地两手抓

HeyGen

HeyGen成立于2020年 11月,核心创始成员有两位,是上海同济大学的校友。

HeyGen联合创始人、CEO徐卓(Joshua Xu),是卡内基梅隆大学计算机硕士。徐卓是早期Snapchat员工(2014年 -2020年),关键工程负责人。在Snapchat的 6年里,徐卓领导了多个关键工程领域,例如广告平台、推荐系统、机器学习平台(Barista)和AI相机

HeyGen联合创始人、CPO(首席产品官)梁望(Wayne Liang),是卡内基梅隆大学人机交互硕士。梁望是前字节跳动美国设计主管,领导企业软件和内部产品创新的设计;Smule前设计总监,领导国际设计团队设计数百万日活产品,领导了视频和直播等关键举措,使UGC内容增长了10倍以上。

HeyGen总部位于洛杉矶,成立三个月后便从红杉中国和真格基金获得了200万至300万美元的种子轮融资。2023年11月 29日,HeyGen宣布获得由Conviction Partners领投的560万美元新一轮投资,估值达到7500万美元。此时,HeyGen只有25名员工。

HeyGen在 2022年 9月推出AI视频创作工具,仅用7 个月的时间实现了100万美元的ARR(年度经常性收入),然后又于10月份达到1000万美元。如今,这一数字已经跃升至1800万美元。

HiDream.ai(智象未来)

HiDream.ai成立于2023年 3月,是一家专注于构建视觉多模态(文本、图片、视频、3D等)基础模型及应用的生成式AI公司。

HiDream.ai创始人兼 CEO 梅涛,是人工智能、计算机视觉和多媒体领域的全球知名学者,加拿大工程院外籍院士,IEEE/IAPR/CAAI Fellow,曾担任京东集团副总裁和微软研究院资深研究员。他发表的论文被引用超过三万余次,先后荣获15项最佳论文奖,拥有70多项专利,并主导研发了多款全球数百万日活用户的商业产品。

HiDream.ai团队中,博士、硕士占90% 以上,核心团队成员曾任职于微软、百度、腾讯、华为、京东、字节跳动等全球500强公司的核心技术团队。

2023年 4月,HiDream.ai核心技术成员组队,完成由阿尔法公社、中喝大种子一号基金参与的种子轮融资;12月,HiDream.ai完成由科大讯飞领投的天使轮融资。

HiDream.ai的产品Pixeling(皮克象)V1.0已经于2023年 8月上线。

Möbius

Möbius是一款上线于2024年 1月 4日的AI视频模型,团队只有三个人:AI算法工程师LogicQ,软件工程师Peki(刘佩),财务Zhao。

1月 14日,Peki在 Reddit上发布了2 个帖子,冲上了Reddit热搜。当时,Peki发布了一个特斯拉汽车视频,比较了Möbius和 Runway的效果,结果被一个小哥骂的狗血淋头,因为Möbius效果太好,以至于让他认为视频是恶意剪辑故意诋毁Runway的。

Peki告诉「甲子光年」,Möbius目前的模型缺陷主要有2个——畸变,当角色大幅度运动时容易产生畸变扭曲;角色一致性,需要所有时长中角色保持一致,也就是语义连贯。这些问题的核心是基础模型,当基础模型要达到一定的智能,真正对物理理解,问题就会解决。Peki表示正在努力。

尽管如此,Peki自信地表示,如果与全球范围内进行产品对比,Möbius和 Sora差距是一定是最小的。

Möbius上线之后,零广告推入情况下,至今已为用户生成了数百万的视频,并获取了可观的收入。

Morph studio

Morph Studio成立于2022年,专注于text-to-video生成技术与社区平台,通过SD+自研模型技术帮助用户实现短视频快速生成,其视频生成模型已经于去年8月上线Discord。

2023年 5月,Morph Studio宣布已完成数百万美元种子轮融资,由百度风投单独投资。

Morph Studio创始人徐怀哲为香港科技大学人工智能方向博士创业,师从倪明选教授和沈向洋教授,曾在微软小冰参加AI音乐生成研发。Morph Studio的两位联合创始人赵世豪、殷子欣都是香港科技大学人工智能博士。

除了技术团队外,Morph Studio也加强了其产品团队的实力,猫眼电影签约制作人、上海国际电影节评委,前硅谷头部AIGC公司核心成员海辛也于近期加入Morph Studio。

Neverends

NeverEnds在 2023年 12月上线。

「甲子光年」独家获悉,Neverends的联合创始人,为Llama中文社区联合发起人曲东奇。曲东奇毕业于东南大学,德国亥姆霍兹研究中心访问学者。曲东奇也是《Llama大模型实践指南》一书的作者之一。

爱诗科技AIsphere

爱诗科技成立于2023年 4月,已经完成了数千万元人民币天使轮融资。

爱诗科技创始人、CEO王长虎深耕计算机视觉、人工智能领域20年,曾任字节跳动视觉技术负责人,参与了抖音和TikTok等产品从0 到1 的建设和发展,搭建了字节跳动视觉算法平台和业务中台,主导了字节跳动视觉大模型从0到1的建设。王长虎曾任微软亚洲研究院主管研究员,发表国际论文百余篇,拥有专利数百项。

爱诗科技团队成员来自清华、北大、中科院等顶级学府,曾任职于字节、微软亚洲研究院、快手、腾讯等头部机构的核心技术团队,拥有世界一流的计算机视觉算法攻坚能力和解决系统工程问题的经验。

爱诗科技的视频生成工具Pixverse,支持4K高清视频生成,在运动准确性、一致性和丰富性等方面取得了进展。爱诗科技将在2024年 3月发布新版本的多模态视频生成大模型。

李白人工智能实验室(LibAI Lab)

李白人工实验室是杭州王道控股有限公司旗下的专注计算机视觉和生成式人工智能算法、产品研发的技术团队,成立于2018年,由唐勇博士领导成立。

唐勇毕业于美国宾夕法尼亚州立大学,在美国知名500强企业担任技术学科专家,高级工程师等。其他成员均毕业于国内外知名高校,清华、北大、浙大、英国皇家理工和美国常青藤范围等。

李白人工智能实验室在图像生成方面已经有不少积累,推出的产品有神采PromeAI图可丽 tukeli.net、cutout.pro等国内外在线工具网站及多个App、小程序。其中cutout.pro项目海外月活超千万用户,海外站更是跻身图像编辑工具分类排名前十;神采PromeAI项目荣获AI产品榜出海20强。

去年10月 31日-11月 2日,由李白人工智能实验室团队携手阿里云等团队制作的李白数字展亮相云栖大会。

近期,李白人工智能实验室神采PromeAI也上线了图生视频功能。

毛线球科技(6PenArt)

6Pen成立于2022年 4月,产品正式上线于7 月,从AI绘画工具起步,逐步打造AIGC社区。

6Pen同时提供两个模型:一个是基于Disco Diffusion的模型「西瓜」,优点是图片效果好,但速度非常慢,成本会非常高;另一个是小模型「南瓜」,可以用更快的速度去生成图片。据介绍,用户普遍做法是先采用「南瓜」绘图,如果画作满意,继续使用参考图的方式传输到「西瓜」模型,也就是Disco Diffusion上,再进行一次重新生成。

自上线以来,6Pen通过10余项产品功能创新,获得纯自发增长,4个月积累了百万优质注册用户,付费率超过5%,上线首月即开始盈利。6Pen文字生成视频模式也正在内测中。

2023年 6月,6Pen获得奇绩创坛的A 轮融资。

6Pen是一个非常年轻的团队。6Pen CEO王登科出生于1994年,为10年内容创作者、连续创业者,曾独立开发过被App Store推荐的App,打造过创作者经济社区「面包多」。前段时间爆红网络的“哄哄模拟器”,就是由他开发。

6Pen CTO邵万博出生于1995年,曾在字节负责IoT云平台项目,实现字节教育硬件云服务、AILab机器人云服务的从无到有,包括整体架构设计与核心功能开发。

方轲为Al负责人,4年快手AI工作经验,核心算法研发,曾获得快手内部技术突破奖。

生数科技

生数科技成立于2023年 3月,由瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化,聚焦于多模态生成式大模型与应用产品开发。前瑞莱智慧副总裁唐家渝出任 CEO

生数科技由清华人工智能研究院副院长朱军教授带领,核心成员来自清华大学人工智能研究院,该团队长期致力于贝叶斯机器学习的基础理论和高效算法研究,是目前在扩散概率模型领域发表论文成果最多的国内团队,并培养出了多名生成式AI领域重要的研究者。

生数科技于2023年初开源了基于Transformer的多模态扩散大模型UniDiffuser,实现基于一个底层模型完成文生图、图文联合生成、图文改写等多种生成任务。生数科技也正从0 到1 打造着产业级的多模态深度生成式大模型,覆盖文本、图像、3D模型、音视频等多个模态。目前该大模型正在快速迭代中。

2023年 6月,生数科技完成了近亿元的天使轮融资。此轮融资由蚂蚁集团领投,BV百度风投、卓源资本跟投,估值达1 亿美元;8月,生数科技完成了数千万元天使+轮融资,由锦秋基金独家投资。

在商业模式上,生数科技面向图像创作、3D资产创建等细分场景打造垂类应用,服务范围覆盖C、B两端。

徐图智能

徐图智能成立于2023年 6月,由IEEE Fellow、香港大学教授徐东成立。

徐东担任徐图智能CEO,他于2001年和2005年在中国科学技术大学取得学士和博士学位,目前担任香港大学计算机系教授。他曾在微软亚洲研究院、香港中文大学和哥伦比亚大学从事研究工作,并在南洋理工大学和悉尼大学任教。

徐东教授在计算机视觉、多媒体信号处理以及机器学习等领域做出了重要贡献,在IEEE Transactions和国际顶级会议上发表了150余篇论文,其中两篇论文分别获得T-MM 2014最佳论文奖和CVPR 2010最佳学生论文奖。徐东教授是IEEE和 IAPR Fellow,于2018和 2021年两次入选科睿唯安(Clarivate Analytics)高被引学者,同时也担任ACM Computing Surveys(CSUR)资深副主编。

艺映AI

艺映AI是由MewXAI团队开发的AI视频生成工具,可以由文本、图像生成AI视频。可以将文本描述转换为视频动画,也可以上传图片将其变为动态视频,适用于多种场景,如抖音短视频、小说推文、AI短片、AI电影等制作。

除了AI视频生成工具「艺映AI」之外,MewXAI还包含了AI绘画、AI二维码、AI艺术字等多种AIGC创作工具。

MewXAI由美团资深前端工程师华益峰创立,华益峰是一位出生于1995年的年轻独立开发者。除了MewXAI之外,华益峰还创立了木及简历、goenhance.ai(面向海外市场的视频生成工具)等产品。

右脑科技(RightBrain AI)

右脑科技成立于2022年 9月,是一家专注研发AI图像和视频生成的初创公司, 致力于将AIGC技术应用于图像及视频领域,赋能创作,让想象成为具象。

右脑科技有三位核心创始成员,均毕业于北京大学。

梁建是北京大学计算机科学硕士,曾在微软亚洲研究院任职,长期从事视觉生成研究,代表作女娲系列NUWA、NUWA Infinity。

史杰是北京大学智能系统硕士,曾在微软亚洲研究院,女娲项目组从事Diffusion模型研究;曾任商汤研究员,负责扩散视频生成模型研究。

周呈华是北京大学软件工程硕士,曾在微软亚洲搜索技术中心(Search Technology Center Asia,STCA)、智源研究院从事视觉生成研究,参与智源悟道·文生图模型、国画模型研发。

右脑科技已经完成了陆奇博士创立的奇绩创坛的种子轮,以及光速中国等一线VC数千万天使轮融资。

产品层面,右脑科技先后推出了AI绘画创作平台Vega AI,以及AI视频创作平台Video Studio。

大厂:有钱有人,论文多于产品

阿里:周靖人、薄列峰领衔

在视频生成领域,阿里巴巴通义实验室开发了开源视频生成模型和代码系列 VGen,具备非常先进和完善的视频生成系列能力,包含了如下内容:

VideoComposer:具有高度灵活可控性的视频合成

I2VGen-XL: 通过视频扩散模型进行高质量图像到视频的生成。

HiGen:分层时空解耦技术用于文本生成视频(T2V)

TF-T2V:使用无文本视频训练的规模化文本到视频模型的生成方法

InstructionVideo:通过人类反馈,优化视频扩散模型

DreamVideo:用定制主题和动作可控视频生成模型

VideoLCM:基于潜在性一致模型(LCM)优化视频模型生成速度

2023年 11月,阿里发布了关于I2VGen-XL的论文,署名作者有9 位:Shiwei Zhang,Jiayu Wang,Yingya Zhang,Kang Zhao,Hangjie Yuan, Zhiwu Qing,Xiang Wang,Deli Zhao,以及阿里云CTO周靖人。

12月,阿里巴巴智能计算研究院发布了最新AI应用:Animate Anyone,只需一张人物照片,结合骨骼动画,就能生成人体动画视频。通义千问风靡一时的“一键跳科目三”功能就是来自于此。

Animate Anyone的论文有6 位作者:胡立、高鑫、张鹏、Ke Sun、张邦与薄列峰

其中,第一作者胡立,浙江大学硕士毕业后加入阿里达摩院,在COCO、DAVIS等大型知名Benchmark竞赛上取得多项第一,在CVPR/ICCV/ECCV等顶会上发表多篇论文。

该项目的核心负责人薄列峰,是阿里巴巴集团XR实验室负责人。

薄列峰博士毕业于西安电子科技大学,先后在芝加哥大学丰田研究院和华盛顿大学从事博士后研究,在国际顶会和期刊论文80余篇,论文被引用超1.1万次。其中,他的博士学位论文曾获得全国百篇优秀博士论文奖,RGB-D物体识别论文荣获机器人权威会议ICRA最佳计算机视觉论文奖。

薄列峰曾就职于亚马逊西雅图总部,任首席科学家,从事Amazon Go无人零售店的基础算法研究和工程落地。2017年,薄列峰加入京东,后加入京东数字科技集团AI实验室首席科学家,研究范围覆盖机器学习,深度学习,计算机视觉,自然语言处理,语音等多个领域。

2022年,薄列峰加入阿里巴巴达摩院,现在为通义实验室XR实验室负责人。

百度:肖欣延领衔

2024年 1月 19日,百度推出了一款视频生成模型UniVG,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。

该模型论文有5 位作者:Ludan RUAN、Lei TIAN、Chuanwei HUANG、Xu ZHANG、肖欣延。

其中,肖欣延为百度文心一格总架构师。肖欣延长期从事自然语言处理相关研究和应用,已发表CCF A/B类论文30余篇获授权发明专利50余项并获中国专利优秀奖1项,相关成果已在百度的搜索、推荐、百家号、小度、输入法、百度云等业务中得到广泛应用。

腾讯:单瀛领衔

腾讯近期推过两个视频生成模型项目,第一个是在2023年 12月,北京大学、腾讯AI Lab与香港科技大学三家联合发布一款视频生成模型 AnimateZero。

AnimateZero是一种基于视频扩散模型的零样本图像动画生成器。研究人员提出了一种分步生成视频的方法,将外观和运动过程解耦,提高生成效率和可控性。通过零样本修改,还能将T2V模型转换为I2V模型,使其成为零样本图像动画生成器。在应用方面,AnimateZero介绍了通过文本控制动作、视频编辑、帧插值、循环视频生成和真实图像动画等多种应用场景。

在该项目中,腾讯 AILab有 4位作者参与,分别为寸晓东、Yong Zhang、Xintao Wang与单瀛

单瀛,腾讯杰出科学家、ARC Lab& AILab CVC总监。单瀛博士曾担任微软雷德蒙研究院博士后研究员,SRI International资深研究员和微软科研主管,在国际顶级会议和刊物上发表120多篇论文,并拥有多项美国/国际专利。2018年底单瀛加入腾讯公司内容和平台事业群(PCG),创立了ARC Lab并担任中心主任,同时兼任腾讯AI Lab视觉计算中心主任、QB搜索技术负责人,致力于多模态内容生成、理解、学习中的算法研究和应用推广。

寸晓东,腾讯AI Lab视觉计算中心研究员,本科毕业于西安电子科技大学计算机系,硕士与博士毕业于澳门大学计算机与信息科学系,导师是潘治文教授。加入腾讯之前,寸晓东先后在阿里巴巴、海康威视研究院、华为诺亚方舟实验室工作。目前,寸晓东正在使用与AIGC相关的技术,研究设计新颖的图像/视频生成、翻译和编辑应用(特别是在动漫游戏领域)。

Yong Zhang,腾讯AI Lab高级研究员,研究方向是AIGC。在加入腾讯之前,Yong Zhang于 2018年在中国科学技术院自动化研究所(CASIA)获得了博士学位,导师是胡包钢教授和董未名教授,他们都是国家模式识别实验室(NLPR)的成员。在加入CASIA之前,Yong Zhang于 2012年在湖南大学获得了自动化专业的工学学士学位。从2015年 9月到2017年 9月,Yong Zhang在伦斯勒理工学院(RPI)的智能系统实验室(ISL)担任联合博士生,导师是Qiang Ji教授。

Xintao Wang,目前是腾讯ARC Lab和腾讯AI Lab的高级研究员,领导视觉内容生成(AIGC)方面的工作。 此前,Xintao Wang获得了香港中文大学多媒体实验室(MMLab)博士学位, 导师为Chen Change Loy教授和汤晓鸥教授。早些时候,Xintao Wang获得了浙江大学的学士学位 。

腾讯近期推出的第二个视频生成项目,是在2024年 1月推出的VideoCrafter2。VideoCrafter2是一个视频处理工具,致力于提高视频的视觉质量、动态效果以及概念组合。通过独特的算法和先进的技术,VideoCrafter2能够生成精美影片。

VideoCrafter2参与成员有7位:Haoxin Chen、Yong Zhang、寸晓东、Menghan Xia, Xintao Wang、Chao Weng、单瀛,大部分成员也参与了上述AnimateZero项目。

Haoxin Chen目前是腾讯的研究员,主要研究文本到视频的生成。在此之前,Haoxin Chen毕业于华南理工大学,获得学士和硕士学位。

Menghan Xia, 腾讯AI Lab视觉计算中心的一名研究员,目前专注于基础生成模型(AIGC)、多模态学习和面部运动合成。Menghan Xia于 2021年在香港中文大学(CUHK)获得了计算机科学与工程博士学位,导师是黄田津教授;于2014年获得了武汉大学摄影测量与遥感专业的工学学士学位,以及2017年获得了模式识别与智能系统专业的工学硕士学位,两位导师都是姚剑教授。在攻读博士学位期间,Menghan Xia 自2019年 3月起与Adobe Research进行了为期一年的合作,并在2021年夏天在微软亚洲研究院(MSRA)进行了研究实习。

字节跳动:冯佳时、李航领衔

字节跳动有多个AI视频研究团队,其中一个在新加坡。

2023年 12月,新加坡国立大学的Show Lab联合字节跳动发布了一款视频模型MagicAnimate——一种基于扩散模型的人体图像动画框架,旨在增强时间一致性、忠实地保留参考图像并提高动画保真度。

字节跳动有5 名研究人员参与。其中,冯佳时曾为新加坡国立大学电子与计算机工程系的助理教授,研究兴趣包括计算机视觉和机器学习。冯佳时教授目前已经加入TikTok担任研究科学家,正在组建一个新的基础研究团队。

其他成员包括:

Jianfeng Zhang,字节跳动研究科学家,致力于3D生成模型和数字人生成/动画方面的工作。Jianfeng Zhang本科毕业于武汉大学,博士毕业于新加坡国立大学。Jianfeng Zhang曾在Meta Reality实验室、TikTok和 Sea AI实验室实习。

Jun Hao Liew,毕业于新加坡国立大学,曾在Adobe计算机视觉研究院实习,现在为字节跳计算机视觉科学家。

严汉书,字节跳动新加坡的一名研究科学家,团队专注于开发高效且可控的视频/图像生成模型,并将它们应用于创意编辑任务。严汉书在新加坡国立大学博士毕业,研究兴趣在于机器学习和计算机视觉,目标是探索能够解决工程和科学领域中具有挑战性问题的原则性机器学习算法。

Chenxu Zhang,字节跳动Intelligent Creation Lab的一名研究科学家,本科毕业于北京航空航天大学软件工程专业,硕士毕业于计算机,博士毕业于德克萨斯大学达拉斯分校计算机。Chenxu Zhang的研究兴趣包括计算机图形学、计算机视觉和人工智能,重点关注会说话的面部生成、会话手势合成、带有人类运动的去模糊NeRF、文本/图像到3D,以及有情感会说话的数字人。

2024年 1月,字节跳动新加坡团队再次发布新的模型,名为MagicVideo-V2,将文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块集成到端到端视频生成管道中。受益于这些架构设计,MagicVideo-V2可以生成具有出色保真度和平滑度的美观、高分辨率视频。通过大规模用户评估,它表现出了优于Runway、Pika 1.0、Morph、Moon Valley和 Stable Video Diffusion模型等领先文本转视频系统的性能。

该论文共有12位作者,其中就包括上一篇论文的作者Jun Hao Liew、严汉书与冯佳时。MagicVideo-V2的第一作者为王伟民

王伟民本科毕业于新加坡南洋理工大学,硕士毕业于新加坡国立大学,毕业后先后在新加坡房地产交易所、医药公司MSD、印度尼西亚的互联网科技公司GO-JEK做数据相关工作,在亚马逊做机器学习研究科学家,并于2020年加入字节跳动,是字节跳动视频生成模型的负责人。

2022年 4月,王伟民参加了新加坡国家研究基金会下属人工智能研究计划「AI Singapore」发起的“可信任媒体挑战” ,在为期五个月的挑战中击败了来自世界各地的469个团队获得了第一名,以开发用于检测深度伪造或数字修改视频剪辑的最佳AI模型。

其他团队成员还包括:

Zhijie Lin,毕业于浙江大学,现在为字节跳动研究员;

陈硕,TikTok新加坡的一名研究科学家,本科就读于南京邮电大学物联网学院;硕士就读于清华大学电子工程系,导师是廖庆敏教授和周飞博士;博士就读于阿姆斯特丹大学,导师是Cees Snoek教授和Pascal Mettes博士。陈硕曾作为访问学生在深圳先进技术研究院多媒体研究中心学习,导师是乔宇教授。

Chetwin Low,曾在新加坡国立大学做学生导师与本科研究助理,目前在TikTok做计算机视觉研究实习生。

Tuyen Hoang,毕业于新加坡南洋理工大学,现在为字节跳动算法工程师。

Jie Wu,字节跳动Intelligent Creation Lab的一名计算机视觉工程师,本科与硕士毕业于汕头大学,曾在百度计算机视觉视觉技术部(VIS)实习,师从人机物智能融合实验室的李冠彬教授和林倞教授。

Daquan Zhou,新加坡国立大学毕业生。

2024年 2月,春节假期之前,字节跳动研究院又推出了一款新的 AI 视频生成产品Boximator可以通过文本控制生成视频中人物或物体的动作。Boximator是基于MagicVideo-V2模型发布的一款视频模型产品Demo,将会在未来2~3个月内正式推出。

Boximator论文共有7 位作者,分别为Jiawei Wang*、Yuchen Zhang*、Jiaxin Zou、Yan Zeng、Guoqiang Wei、Liping Yuan与 Hang Li。最后一位作者为李航,字节跳动研究院负责人。

李航是北京大学、南京大学客座教授,IEEE Fellow、ACM杰出科学家、CCF高级会员,本科就读于日本京都大学电气工程系,1998年在日本东京大学获得计算机科学博士学位。

1990年至2001年,李航曾在日本NEC公司中央研究所担任研究员,期间从事了NEC文本数据挖掘产品的开发。2001年至2012年,李航就职于微软亚洲研究院,任研究员、主任研究员、高级研究员。2012年至2017年,李航在华为诺亚方舟实验室任首席科学家、实验室主任,2017年离职加入字节跳动。

2019年,李航作为唯一华人当选ACL Fellow,当选理由为“他对信息检索,特别是排序学习做出了基础性贡献,在深度学习和对话生成方面做出了突出贡献,并且促进了中国自然语言处理(NLP)的发展和商业化。”

除了上述三个项目,字节跳动还在北美筹建团队。据「甲子光年」独家获悉,英伟达高级科学家、VideoPoet项目负责人蒋路,已经加入TikTok北美团队。

注:文/赵健,文章来源:甲子光年(公众号ID:jazzyear),本文为作者独立观点,不代表亿邦动力立场。

文章来源:甲子光年

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享
+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0