21天入门机器学习

小白入行 AI 的必修课

标签: 机器学习   AI   python  

21天入门机器学习

AI 时代,大家都对各种人工智能岗位充满好奇和憧憬,但普遍都不了解,各个岗位具体是做什么工作的。在这里给大家打个比喻,虽然不太恰当,但非常形象!

  • 做算法是屠龙,仗剑江湖,天外飞仙;
  • 做工程是狩猎,跃马奔腾,纵酒狂歌;
  • 做数据是养猪,每天拌猪食清猪粪,一脸土一身泥。

AI 原本是一个专业领域,没什么特别的。作为码农一枚,笔者的工作内容正好在这个领域。

近年来,连续发生了多件事情,使得笔者不得不抬起原本一直低着敲代码的头,看看这个为 AI 狂欢的世界。

【Case1】 居然在一个月里碰到两位在相对传统行业创业的亲友,来打听将AI技术应用到他们所在行业上的问题,例如:是聊天机器人是否可以代替人工客服。

两位亲友居然都动了雇佣一位算法工程师的念头。其中一位真的已经开始物色了。颇费周折找到一位某非 985 院校专业对口的博士,友人有点动心想要聘用,奈何人家开口就要百万年薪。

创业企业虽然已经拿了两轮融资,还是不敢烧钱作死,故而多方打听“算法”这东西的用处。

【Case2】 笔者所在公司今年的校园招聘,本人照例作为 interviewer 参加,面试了几个来自不同 985 院校的学生(明年毕业)。顺便又和几位今年刚入职的应届生聊了聊。

结果发现,所有 interviewee(至少是我碰到的),全都是人工智能或机器学习方向的学生,所有交流过的新同事,在学校里做的也全部都是机器学习 or 深度学习算法。而且,每一个人对于入职后工作的期望都是做算法。

人工智能,已经跌入到两三年前大数据风口上,全民皆“数据科学家”的套路里了。

01. 到底做什么,才算入行 AI?

工业界直接应用 AI 技术的人员,大致可以分为三个不同角色:算法、工程,和数据。

我们不说怎么能够成为XXX,我们先来看看成为XXX之后要做什么事情,而做这些事情,需要什么样的能力,在拥有了这些能力、做上了这件事情之后,又能向什么方向发展。

1. 做算法

日常工作

所有人都想做算法,那么,说到底,在工业界做算法倒是干什么?

真正的算法工程师(也有公司叫科学家),最基本的日常工作其实是:读论文&实现之——确认最新论文中的阐述是否真实可重现,进一步确认是否可应用于本企业的产品,进而将其应用到实践中提升产品质量。

必备能力

既然日常工作首先是读别人论文。那么,必不可少,作为算法工程师得具备快速、大量阅读英语论文的能力。

在计算机科学,尤其是人工智能、机器学习、深度学习这几个当今世界最热门的领域里,大家都在争分夺秒地抢占制高点,根本不能容忍耽搁时间。 之地。

如果要做算法,平均而言,大致要保持每周读一篇最新论文的频率。

也许这就是为什么,到目前为止,笔者所听闻和见过的算法工程师都是名校相关专业博士的原因。经过几年强化学术研究训练,这些博士们,就算英语综合水平不过 CET-4,也能读得进去一篇篇硬骨头似的英语论文!

理论联系实际,将学术论述与产品、业务结合的能力

一般来说,在大企业里做到真正的算法工程师/科学家,也就不需要自己去动手开发产品了。但做 demo/prototype 还是不能避免的。

算法工程师,可不是用别人写好的工具填几个参数去运行就可以的,需要负责实际业务问题到数学模型的抽象,并能够将他人最新成果应用到业务数据上去。

说得更通俗一点,就算是用别人写的工具或框架,做算法的,也得是 i)第一拨、最前沿那批试用者,或者 ii)工具最新玩法的发明者。

2. 做工程

日常工作

相对于算法的创新和尖端,做工程要平实得多。

这一角色比较有代表性的一种岗位就是:机器学习工程师(或戏称调参工程师)——他们使用别人开发的框架和工具,运行已有算法,训练业务数据,获得工作模型。

其间可能需要一些处理数据、选取特征或者调节参数的手段,不过一般都有据可循,并不需要自己去发明一个 XXXX。

做工程也得读论文,不过和做算法不同,做工程读论文的一般目的不是尝试最新方法,而是用已知有效的方法来解决实际问题。

TIP:很多 title 写的是“人工智能/机器学习/深度学习算法工程师”的招聘岗位,其实招的是做工程的人。不要执着于辞藻,看清楚具体职责和工作内容。

做工程,「机器学习」学到多深够用

当然,既然是有领域的程序员,在专业上达到一定深度也是必要的。

虽然做工程一般要使用现成技术框架,但并不是说,直接把算法当黑盒用就可以做一名合格的“调参”工程师了。

把算法当黑盒用的问题在于:黑盒能够解决问题的时候,使用方便,而一旦不能解决问题,或者对质量有所要求,就会感觉无所适从。

作为程序员、工程人员,想用机器学习算法解决实际问题,就得对算法有一定程度的掌握,此外对于数据处理和模型验证,也需具备相应知识。

3. 做数据

此处说得做数据并非数据的清洗和处理——大家可以看到做工程的岗位,有一部分工作内容就是 ETL 和处理数据。此处说的做数据是指数据标注。

标注数据的重要性

虽然机器学习中有无监督学习,但在实践领域被证明有直接作用的,基本上还都是有监督模型。

近年来,深度学习在很多应用上取得了巨大的成功,而深度学习的成功,无论是图像、语音、NLP、自动翻译还是 AlphaGo,恰恰依赖于海量的标注数据。

无论是做 ML 还是 DL 的工程师(算法&工程),后者有甚,都共同确认一个事实:现阶段而言,数据远比算法重要。

所以,虽然这是一件谁都能干的工作,但是恐怕没几个人想干。

02. 认清形势,脚踏实地

近来一段时间,能明显感到,想入行 AI 的人越来越多,而且增幅越来越大。

为什么这么多人想入行AI呢?真的是对计算机科学研究或者扩展人类智能抱着无限的热忱吗?说白了,大多数人是为了高薪。

人们为了获得更高的回报而做出选择、努力工作,原本是非常正当的事情。关键在于,找对路径。

寻求入行的人虽多,能真的认清市场当前的需求,了解不同层次人才定位,并结合自己实际寻找一条可行之路的人太少,基于此才有了 21 天机器学习训练营。

3 月 1 日第 5 期 21 天机器学习训练营即将正式开班,此训练营是目前业内仅有的能够定制线上学习解决方案的产品,在提供含金量超高的课程内容同时,也配套相应的学习计划和学习服务,几乎是手把手教你透彻地入门机器学习,并通过助学金奖励以及助教监督的方式提升你的学习效果。

第 5 期开放 200 个名额,报名截止 2 月 28 日,3 月 1 日正式开营。

03. 课程介绍

课表
课表

扫描下方二维码报名参加即可(报名成功后可以加我微信iEverything,给你返一个红包哦): qrcode

微信公众号

扫描下面的二维码关注我的微信公众号,在微信公众帐号中回复'群'即可加入到我的"kubernetes技术栈"讨论群里面共同学习。

wechat-account-qrcode

「真诚赞赏,手有余香」

青牛踏雪

请我喝杯咖啡?

使用微信扫描二维码完成支付

相关文章