您现在的位置是:网站首页> 内容页

两个栗子:如何正确建立个人机器学习项目集

  • 博猫游戏平台注册官网
  • 2019-09-27
  • 164人已阅读
简介当面试机器学习时,你会在你的个人简历中写些什么?建模?做机器学习项目?项目数据来自哪里?在SharpestMinds的创始人Edoua

    当面试机器学习时,你会在你的个人简历中写些什么?建模?做机器学习项目?项目数据来自哪里?在Sharpest Minds的创始人Edouard Harris介绍的两个成功的例子中,人们从收集基本数据逐步开始他们的项目:清晰的目标,到极端。我是一名物理学家,在YC创业公司工作。我们的任务是帮助新生找到他们的第一份机器学习工作。要找到第一份机器学习工作,你需要做的一件事就是建立自己的投资组合。现在,让我告诉你答案。你可能会奇怪为什么这很重要,因为招聘经理通常通过你的简历了解你。如果你没有简历,个人项目是最好的选择。出于职业原因,我看过数百个单独的项目案例,其中一些做得很好,而另一些做得很差。我将向您展示两个极好的例子。接下来我想说的是一个真实的故事,但是为了隐私,我改变了主角的名字。X公司使用人工智能来提醒杂货店何时订购新的库存。我们这边有个学生,Ron,非常想在X公司工作,所以他设立了一个个人项目,完全是为了面试X公司。我们通常不建议我们全力以赴为这样的公司做准备。这有点冒险。然而,罗恩真的很想去这家公司,这是另一回事。缺失的项目标记在红色的边框中。罗恩刚开始把手机放在购物车上。然后他把车子推上推下走道,用相机记录下来。他在不同的杂货店里做了10到12次。当他回到家,罗恩开始建立一个机器学习模型。他的模特在杂货店的货架上发现了一个空的缺陷:货架上没有玉米片(或其他东西)。Ron在GitHub上实时构建模型,并完全公开。每天,他改进他的回购(提高准确性,并在回购的README中记录项目更改)。当X意识到Ron正在这么做时,X不仅对此感兴趣,而且事实上X有点紧张。他们为什么紧张?因为Ron在几天内就无意识地复制了他们的专有技术堆栈的一部分。当然,Ron所做的远非完美:X为解决这个问题投入了比Ron多几个数量级的资源。但是,因为他们是如此相似,他们很快要求罗恩私有化他的回购。X公司的技术在同行业中排名第一。然而,在四天之内,罗恩的项目得到了X公司首席执行官的直接个人关注。下面是关于试点项目的另一个真实故事:Alex是历史专业的学生,主修俄语(真的),对机器学习感兴趣。更不寻常的是,尽管他从未编写过Python代码,但他决定学习它。亚历克斯选择通过构建实际项目来学习。他决定建立一个分类器来检测战斗机飞行员在机上是否失去知觉。亚历克斯希望通过观看飞行员的视频来找出答案。他知道一个人在失去知觉时很容易观察并告诉飞行员,所以亚历克斯认为机器应该能够做到这一点。这就是亚历克斯几个月以来所做的:亚历克斯的G力演示了如何诱导无意识探测器。Alex在YouTube上下载了所有飞行员从驾驶舱飞来的视频剪辑(大约几十个)。然后他开始标记数据。Alex创建了一个UI,允许他滚动数千个视频帧,按一个按钮显示“有意识”,按另一个按钮显示“无意识”,并自动将帧保存在正确标记的文件夹中。标记过程非常,非常无聊,花费了他很多天。亚历克斯为图像建立了一条数据管道,它可以将飞行员从驾驶舱背景中切出来,使得他的分类器更容易将注意力集中在飞行员身上。最后,他建立了意识丧失分类器。在做这些事情的同时,Alex还向招聘经理展示他在社交活动中的项目快照。每当他拿出他的项目,并显示在他的手机上,他们问他是怎么做到的,他如何建立管道,以及如何收集数据。但是他们从来没有问过他的模型的准确性(低于50%)。当然,亚历克斯计划提高他的准确性,但是他在开始之前就被录用了。事实证明,公司更看重其他项目的视觉效果以及他们在数据收集过程中表现出来的疯狂和智慧,而不是他们模型的准确性。为什么罗恩和阿历克斯这么成功?因为他们正确地做了以下四件事:他们不会在建模上浪费太多精力。我知道这听起来很奇怪,但是对于今天的许多用例,建模是一个已经解决的问题。实际上,除非你进行前沿研究,否则80%到90%的时间将花在清理数据上。你的个人项目如何才能出类拔萃?他们自己收集数据。因此,他们得到的最终数据比Kaggle或UCI数据库中的数据更令人困惑。但是正是这些混淆的数据提高了他们处理混淆数据的能力。这使得他们能够比从学术服务器下载数据更好地理解他们的数据。他们会想象他们正在做什么。所谓面试,不是指全能裁判客观地评价你的能力,而是指你向别人推销自己。人是一种视觉动物。如果你拿出手机向面试官展示你的工作,确保你所做的看起来很有趣是值得的。他们的所作所为似乎有点疯狂。普通人不用磁带把手机绑在购物车上。普通人不会花那么长时间剪辑来自YouTube的导航视频。什么样的人能做这样的事?那些急于实现目标的人会这样做。那是公司最想雇用的那种人。罗恩和亚历克斯看起来有些夸张,但事实上,这和你在实际工作中做的差不多。这就是重点:当你没有做某件事的工作经验时,招聘经理会看看你做了什么和你做过的相似的事情。幸运的是,在这个级别上,你只需要做一两个项目——Ron和Alex正在使用他们准备的项目,然后他们在所有的面试中重复这些项目。因此,如果一个伟大的ML项目的秘密总结为一句话,那就是用有趣的数据集构建一个项目需要花费大量的精力来收集和尽可能具有视觉影响力。

文章评论

Top