科技公司的大模型风潮仍在持续,小米也不例外。
8月中旬,雷军在小米周年演讲上正式公布了小米在大模型方面的成果。和外界想象所不同的是,今年4月小米宣布成立大模型团队之前,内部就已决定不会跟风去做超大规模的大模型。
大模型对于小米而言,更多是一个潜在的智能手机市场的新机会。“大家都在说5G好像没啥东西,可能AI大模型就是为5G而生的,是5G时代一个最重要的杀手级应用。”小米集团高级副总裁、手机部总裁曾学忠表示。
(资料图片仅供参考)
小米集团AI实验室主任王斌解释称,大模型是一场科技革命,不过从专业的角度来看,它最本质的是对用户的理解深入了很多。为了结合小米本身的特色,团队最终选择了轻量化、本地部署作为技术突破方向。
王斌介绍了小米当前的大模型技术路线图,主要做了两个模型,一个是13亿级,一个是60亿级,总体按照五倍拓展速度进行规划。
“我们做的这些模型是从零开始,包括模型、数据、算法都是自己重头去做的。”王斌说。“我们也不反对第三方的大模型,小米一直非常开放,我们会坚持自研和第三方合作相结合,来推动我们大模型的发展。”据悉,小爱同学现在的大模型版本就采用了第三方和自研的混合方案。
目前,大模型版本的小爱同学可以解决出题、文生图等娱乐性任务,以及内容方面的创作性任务。接入大模型之后,小爱的翻译水平有明显提升,例如在“梅西来中国踢球促进了中阿人民之间的友谊”一句的翻译中,小爱可以识别出“中阿”是指中国与阿根廷。
“AI大模型跟手机相结合,从小爱这一产品上就能看到非常大的潜力。”王斌说。
在数据训练规模方面,小米目前大部分使用公开数据,训练数据量在万亿级token。就落地方向而言,端侧设备将是其重点方向,手机之外,机器人、电视等都是其考虑接入的场景。
端侧大模型的优势主要在于隐私保护、响应速度等,并且基于随时响应的特性有更广的应用面。不过,相较于云端大模型,端侧大模型的短板在于要消耗端侧算力和资源,同时,复杂逻辑推理相关的任务仍是云端大模型更擅长。
对于端侧大模型涉及的芯片能力,小米也有所布局。据介绍,小米正在与高通和联发科分别合作,就端侧AI底层能力整合进SoC芯片进行讨论。
自雷军在周年演讲上宣布小米科技战略升级后,AI对于小米全局业务的应用就成了一个对外的重要话题。王斌表示,在前期,来自AI实验室的研发成果都已应用于小米智能手机、AIoT、汽车以及机器人业务,未来会继续加速全场景生活的普及。
不仅如此,小米还希望借助大模型巩固高端化战略。
对于如何定义小米的高端化战略是否成功,曾学忠认为商业上的成功是最重要的维度之一,“商业不成功,说那么多没用。”
而小米所指的“商业成功”是利润和规模双增长。规模方面,他以Canalys一季度高端机出货量排名为例,500美金以上的手机里,小米13是国产第一,前面是苹果和三星。利润方面,他称小米中国市场一季度手机平均售价(ASP)创新高,同比增长18%。
智能手机大盘的确已经失去持续增长态势,对于行业可能迎来的突破口,曾学忠提出了一个判断,“当下应该是‘理解你’的时代,AI跟手机的端侧结合可能是让手机实现‘理解你’的大跨越(方式),具体的我也在思考当中。”
(文章来源:界面新闻)