人工智能的目标,就是让机器拥有和人一样的理解与思考能力。但70多年过去了,距离这个目标,仍有着不小的距离。
而对学界来说,尽管当下许多AI技术已经可以对人类生活产生积极的影响,但从大趋势来看,AI研发似乎正走到了一个“瓶颈期”。学界和业界,都需要在技术上发现一个新的”爆点”,来刺激整个AI产业继续向前跨越式地发展。
6月11日,中国汽车动力电池产业创新联盟发布最新数据显示,5月,我国动力电池产量共计13.8GWh,同比增长165.8%,环比增长6.7%。其中三元电池产量5GWh,占总产量36.2%,同比增长62.9%,环比增长25.4%;磷酸铁锂电池产量8.8GWh,占总产量63.6%,同比增长317.3%,环比增长41.6%。
1-5月,我国动力电池产量累计59.5GWh,同比累计增长227.3%。其中三元电池产量累计29.5GWh,占总产量49.6%,同比累计增长153.4%;磷酸铁锂电池产量累计29.9GWh,占总产量50.3%,同比累计增长360.7%。
装机量方面,5月份,国内动力电池装车量共计9.8GWh,同比上升178.2%,环比增加16.2%。
按材料类型来看,5月三元电池共计装车5.2GWh,同比上升95.3%,环比上升1%;磷酸铁锂电池共计装车4.5GWh,同比上升458.6%,环比下降40.9%。
按动力电池厂商来看,5月宁德时代(4.28GWh)、比亚迪(1.68GWh)和LG化学(1.31GWh)的装车量排名前三。
卢志武教授告诉记者,“任何AI的模型到最后其实都是个神经网络。在过去,业内常常使用纯文本或者纯图像的模式对AI进行单模态训练。但现在看来,其效果不是特别有效。”
随着学术上的发展,文澜团队开始把目光转向同时使用图文数据对进行预训练,期望以此能挖掘AI新的潜能。而在此之前,这个方向上还没有较为成功的案例。
为了获得较好的效果,文澜1.0和2.0版本所使用的训练数据从3000万升级到了6.5亿未标注图文数据。巨大的数据量在进行模型训练时非常困难,但这也给文澜拥有强大的视觉-语言检索能力和一定的常识理解能力打下了基础。
在训练方式上,文澜研发团队采用了高效的分布式多模态预训练框架,提出基于DeepSpeed的多模态预训练算法,从而利用GPU和CPU,并最优地支持跨模态对比学习。
目前,国外顶级AI研发机构Google和OpenAI也正在尝试文澜团队的研究方向,其项目名分别为 Google ALIGN和OpenAI CLIP,但在与这两者进行图文互检能力的严格公平比较时,文澜明显要更胜一筹,可以说,目前的文澜,在图文互检和语义理解方面都达到了顶级的水平。
那么,文澜可以应用在何处?卢志武教授告诉记者,现在的文澜,就像“大脑”一样,适应力强,可以应用在多个场景下。以其擅长之一的“检索和推荐”能力举例,电商、游戏、视频中的多个细分行业的常见业务场景中,文澜都能“得心应手”。
卢志武教授表示“如果说过去我们了解到的AI,其理解力还只是个小孩的话,现在的文澜,已经越来越有可能接近一个成人”。