.

阿里资深Leader组建技术团队的一些思

白癜风可以吃干枣吗 http://www.dashoubi.org/gongyi/zonghe/gyzx/2019-03-23/71487.html

“本文是我从年1月底接手CRO线NLP算法团队以来,在团队组建、能力建设、以及管理上的一些思考,全部是没有科学论证的主观判断,不过都进行了实践。

图片来自Pexels

我没有任何管理学背景知识,把拙见没羞没臊地写出来,是为了抛砖引玉,和同学们交流讨论。

团队的定位是什么?——做正确的事

定位

团队的定位是重要的事情之一,有了偏差,后续做得越多错得越多。确定团队的定位花了我很长时间,中间还发生了一次组织变化,和两任主管有多次讨论。

首先,这个团队配置在CRO线,肯定要为风险管理业务服务;同时,这又是一支能力团队,还要考虑和业务团队的协同关系。

最终,我确定了三点:

能力建设为主,同时也需要有业务抓手。不做业务团队已经做得好的事情。立志高远,勇攀高峰,要做就做到最好。

壁垒与价值

不夸张地说,现在是NLP领域的大航海时代,新算法层出不穷,日新月异,后浪各种把前浪碾死在沙滩上。

尤其是BERT横空出世之后,整个NLP的研究范式都发生了变化,从原来的task-specific的模型结构设计转变到语言模型pretrain+下游任务finetuning的模式,预训练模型是含金量高的工作。

研究一下预训练模型,你会发现这是个需要海量金钱+数据+技术才能玩的游戏。

这就陷入两难:如果搞预训练模型,没那么多资源;如果不搞,用开源模型做下游任务,实际上很难有什么技术壁垒。

其实就算你真的搞出什么新算法可以充当技术壁垒,可能两三个月之后就又有人做出了更强的结果。

困境的根源在于,目前NLP算法这个领域发展速度太快了,在高速变化的领域是很难形成壁垒的。所以,我们需要结合自身所处的环境,寻找变化不那么快的东西。

我经过好多天的考虑之后,认为沉淀风险管控知识可以作为壁垒。原因如下:

风险知识随时间有变化,但速度明显比算法慢很多。CRO线在这方面有一定积累,也需要用于实际业务管控,并沉淀到产品。

所以,团队的宗旨我定义为:基于知识驱动的NLP算法团队。为CRO线乃至集团沉淀风险知识,并提供不同层次的服务:

四层服务体系

最近,CRO线在清华举办了AI与安全研讨会,会上张钹院士谈到了第三代人工智能,尤其强调了其中知识的核心作用。

我们走访中科院信工所,对方的宗旨也是建设基于知识驱动的算法,和业界发生的共鸣,更坚定了我们走这条道路的决心和信心。

团队需要什么能力?——了解团队所处环境

阿里是一个什么结构的组织?

有人说是矩阵式的,有人说是树+网状的,我不知道确切的答案。

不过,如果把每个小团队看作节点的话,有两点是确定的:

体量巨大,各种节点(业务、产品、工程、算法)种类繁多数量大。单元节点之间比较容易发生跨大团队甚至跨BU的联系,条件合适可以发生协同关系。

继续观察,你会发现:

你所需要的一切资源几乎都能找到提供者,而且往往不止一个。你也可以给各种需求节点提供服务,只要还在你的能力范围内。由于规模巨大,需求节点和资源节点相互之间往往不知道对方在哪。

基于以上,我认为一个身处中台的算法团队,需要具备四项能力:

连接生产传播服务

能力中台的算法团队需要具备的能力

四项能力

①连接:就是寻找到自己所需要的资源,筛选出其中最优的,建立长期稳定的合作关系。

比如算法团队需要的爬虫、标注工具、分布式模型训练工具、模型的评测工具等,都能在公司范围内获取,就没必要刀耕火种从头开始自己建设了。

②生产:这是传统意义上算法工程师的工作,指获取数据后产出效果和效率达标的算法模型,并上线。

对算法的要求,主管的主管早有论述:算法要全!算法要强!算法要快!算法要便宜!

精炼简洁,振聋发聩,细化一下就有:

对算法的要求

③传播:针对中台的算法团队提的要求,因为你需要让目标业务节点知道你的存在,知道你的能力项,以及细节。

ATA是个不错的对内传播途径,之前在CV团队时,很多业务方是通过ATA找到我的。

④服务:如果是专属某业务的算法团队,只需要考虑该业务下的SLA即可。

如果是中台的算法团队,还需要考虑如何满足不同业务节点的需求,同时又不至于做开发和维护成本很高的个性化定制,避免随着接入业务的增长各种资源的开销也随着线性增长。

能力雷达图

团队的能力雷达图是由成员的个人能力长板组成的。(话越短意思越长)

团队能力雷达图

组织与个人的关系

为什么需要一个组织呢?

先从一个现象出发:在小区业主和物业公司的纠纷斗争中,业主获胜的概率很低。

从人数、个体的教育背景和素质来看,业主都占据绝对优势,可是为什么会输?

粗略分析,大体有三个原因:

共同利益,目标明确。物业的目标非常清晰,就是为了从业主那里赚钱,这也是物业人员的共同利益。业主人多,情况各有不同,各自的利益诉求差异大,容易被分化。组织严密,相互协同。物业内部有明确的分工,平时也长期一起工作,相互间有信任感,能够进行配合。业主彼此之间往往是陌生人,缺乏信任感,难以统一行动,是原子化的散点。局部相对优势。相对单个业主,物业具有明显力量优势。比如,物业有资金,而业主因为缺乏信任很难筹措资金。

好,看出来了,小规模组织的力量可以超过大规模原子化散点存在的个体集合的力量。

组织为个人提供什么?

①组织能使资源增效。

组织能把各种资源组合成有机的整体,使各种分散的力量形成合力,从而产生大于这些资源和力量机械总和的效能。

这个原理多年前亚里斯多德就论述过了,后来马克思又更严密地论述过一次。

②组织是实现目标的依托

个人可以依托组织的能力和资源去做事,而组织的能力和资源远大于个人,所以依托组织的时候,个人能够实现比单打独斗模式大得多的目标。

举个例子,我们团队做了UGC场景效果超越开源模型的预训练模型,每个同学都可以在这个预训练模型的基础上去做下游的有监督学习任务,起点就比别人高。

个人为组织提供什么?

是否有短板不是那么重要,关键是要有长板,能够对组织的能力雷达图做贡献。

这一节留一个思考题:公司设置主管这个职位的目的是什么?是为了像幼儿园阿姨那样,保障每一个小朋友都有自己喜欢的玩具,高高兴兴上学来,平平安安回家去?

招聘团队需要的人才

招聘为什么特别重要?

世界有个普遍规律:在前序阶段做严格的控制会大大降低后序阶段的实现难度,比如数据标注、写代码、模型中的预处理等等。

人招进来之后是要用要管的,招聘的时候高标准严要求,后续管理会轻松很多;如果降低标准甚至放水,后续管理付出的代价远远高于招聘时偷懒省的功夫。

所以,我花了至少1/3的时间在招聘上。对的,至少1/3,你没有看错。从年2月到现在,社招弄了+份简历;校招+份简历。

在这里特别要感谢团队里球夫、天逸、开阳3位同学,牺牲了大量业余时间做简历评估和初面。

从统计数据看,每份简历产生2-3个offer,入职1-2个人。从份简历中招来的人绝对比10份简历中招来的省心很多。

我给算法团队找来过不少人,both社招and校招,具体的展开讨论见彩蛋部分的。

招聘要考察哪些能力?

招聘,首先要确定jobmodel。限于篇幅,这里只讨论“生产”环节所需要的能力。

所处的时代背景:快速变化,新算法层出不穷。

不变的是什么:数学基础、计算机基础、动手能力。

我们很难预测新技术的具体实现,但是当新技术出现的时候,需要能够快速地分析、学习、掌握。

而且,我们经常要解决从来没有遇到过的新问题,这就要求候选人在面对没见过的问题时具备分析判断,在具体约束条件下找完整解决方案的能力。

另外,在复杂的业务场景里,问题经常没有确定性的答案,我们往往通过对过程的合理性来判断整个方案是否合乎要求。

寻找答案的过程很少有一帆风顺的,大概率会遭遇挫折,非常需要候选人不断尝试不断修正去抵达终点。

至于教育背景、之前从业经历,反而不怎么重要。我不赞成对于毕业好几年的社招候选人还要参考毕业学校、最高学位,甚至本科学校是否——如果一个人能力强,是不需要靠学校学位来旁证的,直接用行动证明就行了。

对于候选人的考察,我往往从基础的硬技能、创新性/开放性思维、精神素质三方面考察。

硬技能

数学:概率论与数理统计、矩阵论、随机过程。

计算机基础:操作系统、组成原理、数据结构。

算法能力:领域内主流模型的演进,优缺点对比;在具体设定的场景下选择合适的方案。

动手:C++/Python/Java(什么?你说Matlab?工业界里这个不算编程语言)。

有人说,面试过程中要求做代码测试,就像相亲时要求看存款证明一样残暴。我赞同这个说法,因为不少候选人听到要写代码就高傲地拒绝了。

我给大家推荐一个在线代码测试工具:




转载请注明:http://www.abachildren.com/sszl/2624.html