第一个时刻是一个基于旧贪吃蛇游戏的大学课程项目。然而,这个特定版本有几个独特之处:首先,有两条蛇而不是一条;其次,其中一条蛇使用了我们创造的智能。此外,蛇可以相互交流,这对我来说真的是锦上添花。玩这样一个我小时候玩过无数次的简单游戏,加上我创造的一点小技术,绝对是一次很棒的体验。
第二个是我的硕士论文,在论文中我有机会从头开始创建一个机器学习项目。这个项目真正激励了我,让我能够实施完成数据科学项目所需的所有必要阶段。
我想说我非常喜欢从事数据科学工作的两个主要方面。
我喜欢开始新项目。每次我开始做新事情时,我都会感到兴奋,因为 丹麦 whatsapp 电话号码列表 我知道我必须概念化我能做什么,以便利用我拥有的数据“让机器变得更聪明”。这很令人兴奋,因为它让我能够思考不同的方法来做到这一点,并测试不同的方法以获得更好的结果。
第二个方面与第一个方面密切相关,那就是当我真正得到这些结果并且它们是积极的。当在训练了一台机器之后,它实际上可以提出建议并提供良好的结果时,我会感到非常高兴。这是一种“任务完成”的感觉。
帖子图片
照片由Franki Chamaki在Unsplash上拍摄
3. 您是否需要了解用作机器学习算法输入的数据隐私?如果需要,您是否遵循一些标准指南(GDPR 等)?
是的!在数据科学项目中使用机器学习算法之前,需要做的第一步是清理和探索可用数据。
在此步骤中,如果有任何数据不符合隐私政策,则需要以符合隐私政策的方式删除或屏蔽。根据我在 Advertio 的经验,到目前为止,我还没有遇到过任何敏感数据问题,但无论如何,我都需要始终小心谨慎并遵守隐私政策
4. 为了在尽可能短的时间内得到最佳猜测,你愿意做出哪些妥协?超时?更小的数据集?更低的可接受限度(提供更差结果的概率更高)?
我想说这个问题有两种不同的情况。
第一个考虑的是当我们的平台用户执行操作时需要运行的算法和服务。在这种情况下,是的,需要做出许多妥协。Advertio
提供的是服务,没有客户愿意等待那么长时间来使用该应用程序,所以我们必须使用不允许系统再运行的超时。从逻辑上讲,时间越长通常意味着结果越好,但如果用户厌倦了等待并离开平台,那么所有的努力都将付诸东流。
第二种场景考虑了为用户准备结果所需做的所有工作,例如训练所有必要的模型以获得良好的结果。
在这种情况下,没有太多的妥协需要考虑,因为这没有时间限制。在这种情况下,我通常会尝试使用尽可能多的数据进行训练以获得更好的结果。