>
2022-05-16|
分享到:
|2659 |文章来源:数据派

小米集团崔宝秋: 智能时代 拥抱开源

今天我们要讲五个问题:①智能时代和开源是什么关系、我们为什么要拥抱开源、如何拥抱开源;②拥抱开源,企业界应该做什么;③拥抱开源,学术界和教育界应该做什么;④如今在开源这个领域还存在哪些挑战;⑤我眼中开源的未来是什么,我们应该朝哪个方向努力。

智能时代与开源

几年前,我在小米帮助推动一些技术上的战略,当时定义了一个词,叫做“智能新时代”。


在小米,通过各种数据,我们看到了三个机遇:第一个是AI,2016年阿尔法狗事件让人们看到基于深度学习的新一代人工智能技术的威力,2016年被称为新的AI元年;第二个是2016年IoT开始井喷;第三个则是2019年被工业界认为是5G应用的元年。所以我们把它称为从PC互联网到移动互联网到万物智能互联的物联网的机遇、时代,我们把它叫做三个时代的交汇期,定义为智能新时代,这个和小米的手机×AIoT战略不谋而合。
字面意义讲,IoT也应该包括了手机。从理论上讲,从系统上讲,我也深刻地认为未来的手机将成为物联网中的一个物而已。包括今天很多厂家纷纷进入的智能汽车领域,在万物互联时代,汽车也将是IoT中的一个T。
智能新时代,即今天人们讲的智能汽车、电动汽车、自动驾驶和机器人等,和我们论坛“智能工业软件”有什么关系,小米为什么要提高效率,小米模式的基本核心是什么,下文将作解释。
其实小米模式中的一个关键词就是效率。如何满足人们对美好生活的无限追求,我们的回答是要用高效率生产制造这些智能设备,这些智联网中的各种设备。于是小米开始布局智能工厂。
智能制造、智能新时代和开源是什么关系呢?我们简单看一下开源是什么。开源是个理念,开源是个运动。今天开源的发展如火如荼,开源已经走过了一条非常漫长的路。讲开源软件,我一直提醒大家不要忘了自由软件,从最开始1983年有一个GNU,用开源模式写了一个Unix的替代品,到后面Richard Stallman创立自由软件基金会(FSF),进而有了Linux诞生,之后才有1998年“开源”的创立。
时间拉近一些,二零零几年,以谷歌为代表的大企业开始关注分布式、大数据。当时遥遥领先的搜索引擎谷歌没有开源,但是发布了GFS、MapReduce和Bigtable三篇文章,倒逼雅虎反向工程这些技术并开源了Hadoop,之后也才有了基于Hadoop的HBase等。雅虎为开源社区贡献了辉煌的一笔,正是有了Hadoop才有了后面的云计算、大数据技术的兴起。

所以,当年我来小米的时候开始组建云平台团队、开始推数据科学和数据驱动,就同时也在大力推开源,从云计算到大数据到后面的AI。在AI刚兴起时候我们高调讲ALL IN AI时(全部下注AI)。刚开始我担心,在AI时代大家会不会继续深度拥抱开源,但我的顾虑很快烟消云散,因为看到国内外很多AI巨头都开始拥抱开源。开源是占据领先优势的利器,是一个平台,一个模式。所以,从云计算到大数据到AI时代,开源无处不在。没有开源就可能没有今天的互联网、云计算、大数据、人工智能、物联网,以及智能新时代,或者说它的发展速度远远不会像今天这么迅猛。想象一下,没有Linux就没有今天很多的互联网的节点,没有Linux不可能有安卓,没有安卓可能就没有今天移动OS的兴起,没有Hadoop、分布式、大数据的兴起,可能就没有基于深度学习和大数据的新一代AI技术的快速兴起。
回观国内,近十年中国的开源也如火如荼,发展迅猛。从2018年起,中国在GitHub上的开源贡献就持续占据全球第二位,我相信在未来可能跃居第一。我们也特别重视开源,开源已被列入了“十四五”规划,所以在智能时代,我们离不开开源,更应该深度拥抱开源。

拥抱开源:小米开源实践

小米是一家比较有代表性的业务复杂、技术纷繁多样的企业,接下来将详细介绍小米在开源方面的实践工作。

为什么要拥抱开源?从企业角度来看,当然它可能不仅仅代表企业,开源有助于我们在巨人肩膀上快速创新;且开源软件已经非常成熟,不用就吃亏了。我记得刚来小米的时候,问雷总如何看待开源,他说今天所有创业公司如果不拥抱开源就直接输在了起跑线上,这更加坚定了我大打开源牌的决心。作为一个软件工程师,我特别看好开源对软件人才培养的好处,其他的软件文化、工程文化、吸引人才等也都是企业拥抱开源的原因。

我当时提出了小米的开源理念和开源的几大原则。我们的理念是“不仅要站在巨人的肩膀上,还要为巨人指方向”。就是要为企业降低软件维护和开发成本,在开源社区有一定的话语权,让巨人沿着企业的诉求往前走。

小米开源的五大原则是是:①快,快速选型、快速定位、快速掌握、快速推出产品、快速占领市场。②绝不重造轮子。③不用则已,要用则精。④永远坚持开放与共享,这是开源的精神、理念和价值观。⑤在重大项目上要极力推出自己的Committer,要为巨人指方向。这几大原则至今都没有变,被行业中多家企业借鉴。

拥抱开源:从教育开始

第二部分介绍了企业可以做的一些事情:深度地拥抱开源、回馈开源、和社区一起成长。那教育应该做什么?在学校应该做什么? 

我认为拥抱开源应该从教育开始。今天开源变得越来越重要,它可能是解决我们“卡脖子”问题的一个途径。但一个残酷的现实是,在中国我们的开源后备力量严重不足。如何解决这些问题?过去几年我接触了很多学术界的人,教育界的人,还有其他一些投资人、企业家,我深刻地认为,开源是推动基础技术研发,解决“卡脖子”问题的一个途径。

上图中罗列了过去几年我们遇到的常见问题:招聘单位说“应届生中懂Linux内核的不多”,教育和研究机构说“我们需要用资金来激励开源”,部分老师和学生说“为什么要开源,开源有什么好处”,科研人员会讲“开源难以做到自主可控,有风险”,高校院所负责人说“我们缺乏师资,我们没有懂Hadoop的老师”。开源看似会带来一系列问题,但实则对老师、学生都有好处。

开源对学生的好处:开源启蒙,应该与计算机启蒙同步开始做。开源社区是软件学生最好的学习和交流平台。开源合作,可以从开始培养学生的团队合作精神。开源项目可以让学生最早地享受代码之美、架构之美,由此带来的参与感、成就感也可以极大地激发学生们的学习兴趣。实用开源系统也可帮助学生找到更多的就业机会。

开源对老师的好处:可以吸引优秀学生,增进同行跨行合作,一起解决“卡脖子”问题,可以更好的培养学生动手能力、合作能力,开源也可以促进创新,帮助大家做出研究成果。

当前的挑战

我们今天面临的挑战,从多个维度来看依旧很多,且从上世纪90年代延续到今天,部分问题仍然存在:

1.拿来主义。上世纪90年代该问题十分突出,部分研究者不懂得开源精神,缺乏共享意识,或者有时候花了时间共享,却不被社区接受,各种问题都存在,所以共享程度不足,不够开放。今天很多企业还是为开源而开源,并不了解真正的开源理念和打法。
2.开源边界问题。最早我们一直讲开源没有国界,现在呢?如GitHub的封锁等,让开源似乎有了边界。同时一些科技巨头、AI巨头、云计算巨头、云服务巨头慢慢形成技术的寡头垄断。

我用这张图来代表一个茂密的森林,在森林中,参天大树和地面上的小草都在争抢阳光与雨露,但是小草得不到充足的阳光与雨露,为什么?因为巨头占据了所有的资源。原因之一就是看似开源的项目,实际管理起来是闭源的,所以在这种情况下,开源的边界就慢慢形成了,开源不再那么开放,长远来看不利于开源的快速发展。
最近我也听到一些声音,例如,有人说开源只是一个软件推广与分发的手段,不是万能的;有人说开源是用户增长的渠道,要发展用户,要把应用和服务发到用户群;有人说开源是提升技术品牌的方法,创业公司通过开源,可以提高估值吸引投资;还有人说开源是一个快速盈利的商业模式等。这些说法都对吗?开源仅仅是这些吗?我认为开源远远不仅仅是这些。

开源的未来

开源的未来,有几点大家可以一起助力。

1. 广义的开源。原来讲开源的软件,现在讲开源的硬件,原来讲开源的代码,现在除了代码以外,我们还要讲开源的数据。在AI时代有多少数据就有多少智能,尤其是那些知识图谱类的数据、一些模型,开源出去也是一种价值、一种正能量,是一种人类知识技术的积累,所以广义的开源可以延展出去。
2. 开放的开源。今天开源为什么有了边界,开源真正做的是开放、共享、平等、全球化,这几点需要大家共同努力。
3. 向善的开源。开源是个技术,是个模式,是个平台,多用开源行善。包括在疫情期间,武汉2020这个项目,就是用开源这个模式和平台,在当时帮助了武汉人民,今天我们可以用开源技术帮助更多的人。Deepfake这个问题怎么解决,信息安全和隐私保护怎么用开源解决,都是开源向善的一些思考
4.合力的开源。大家都想做开源,尤其政府倡导开源的情况下,大家都在纷纷拥抱开源,想在开源领域做点事情,但是合作偏少,各自在做一些事情的现象过多,所以我到处呼吁合力的开源。我们应该团结所有的力量,一起为开源做点事情,系统地为开源做点事情。

最后我想用这句话收尾——“在互联网、大数据和人工智能时代,开源是人类技术进步的最佳平台和模式”。这是我心目中理解的开源。
如果我们认为软件定义一切,如果我们相信AI赋能万物,那么我认为我们就应该可以理解“开源是人类技术进步的最佳平台和模式”这一说法。开源不仅仅是一个软件的分发与推广平台,不仅仅是一个用户发展的渠道、手段,不仅仅是一个商业模式或者估值升高的噱头,也不仅仅是一个商业模式。所以,我觉得开源值得清华大学软件学院的学生和老师们一起来拥抱、热爱,让小米和清华大学未来在开源这个领域,在开源能够赋能的几乎所有的技术领域,都展开深度的合作。

文章评论

请输入您的留言: