团队成员明确分工、各司其职,似乎是高效运转的前提。然而对于数据科学团队而言,更需要多专多能的多面手而非专家。对比传统工厂分工模式到现代的数据科学的特点,沃耕编程训练营为你解开其中的原因。
传统工业时代依据职责进行劳动分工,现代科技时代的数据科学也不例外。端对端的业务能力需要许多职责,因此公司通常组建数据科学专家团队,通常包括研究科学家、数据工程师、机器学习工程师、因果推理科学家等。
工厂流水线的目标是执行,但数据科学的目标不是执行。相反,数据科学的目标是学习并发展出新的业务能力,包括算法产品和服务如推荐系统、获客、风格选择分类、尺寸匹配、流行设计系统、物流优化、季节趋势检测以及更多不能事先设计好的产品和服务。系数、模型、模型类别、超参数,这些元素都是需要通过试验、试错、迭代来学习的。就数据科学而言,只能边做边学,而不是在做之前就搞定了一切。
为了鼓励学习和迭代,数据科学里的角色需要更加具有普适性,也就是说,数据科学家的组织,应该朝着适于他们学习的方向优化,也就意味着要雇用从概念设计到建模到实施再到测试的多面手——“全栈数据科学家”。全栈数据科学家在多个职能中无缝切换,扩充数据渠道以添加更多的数据,在模型中试验新特性,部署新版生产系统以作测试,以及当有新的创意时快速重复上述步骤。全栈数据科学家是顺序执行不同职责而不是并行执行的,如此规划时间,所占用的工作时间只会是之前专家等待其他专家资源所花时间的一小部分。所以,总的迭代时间降低了。
全栈数据科学家技能方面的的自主性和多样性,很大程度上是基于有稳定的数据平台的假设。一个架构良好的数据平台将数据科学家从集装箱化、分布式处理、自动故障转移以及其他计算机科学概念中解救出来。除了抽象,一个健壮的数据平台还可以提供无缝对接,如实验性架构、自动监控和报警,提供自动分级,提供测试输出结果和算法结果的可视化。
沃耕编程训练营认为,全栈数据科学家在任何一项职责方面,或许不如专家更加熟练。但是由于全栈数据科学家知悉了整体的上下文信息,可以看到专家所不能看到的机会,因此拥有更多创意,做出更多的尝试。
对于数据科学家来说,只有当职责分工不可避免时,才可进行劳动分工。职责专门化能让人的可靠性和激情丧失。最好的企业文化是提供一切可以提升工作满意度的元素如自主性、掌控力,以及目标感,让人时刻保持对工作的激情。自主性是指数据科学家的成功并不依赖他人,掌控力是指全栈数据科学家从头至尾地了解业务全流程。同时,数据科学家也和正在创造的业务有最直接的联系,故而有目标感。因此,全栈数据科学家是当下数据科学团队中最需要的人才!
全栈数据科学家不是难寻的独角兽,是可以被发现的,同样也是可以培训出来的。沃耕编程训练营被知名媒体Course Report评为2020全世界最佳训练营!是目前在全球科技教育排行榜Switchup排名第一的编程训练营。加入沃耕编程训练营,带你解锁全栈数据科学的学习秘诀!成为数据科学团队中的最强多面手!
相关阅读
赞助商广告