加入收藏 | 设为首页 | 会员中心 | 我要投稿 宜春站长网 (https://www.0795zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 评论 > 正文

健康码 要大一统了!

发布时间:2021-02-02 16:07:36 所属栏目:评论 来源:互联网
导读:案例分析已经成为数据科学和产品开发岗面试中不可或缺的一部分,是决定候选人够不够格的关键点。这些面试的目的是模拟公司现有的产品,测试候选人的反应能力、解决问题的能力、有效处理障碍的能力。一般来说,有三种类型的案例研究问题: 产品相关型 模型相

案例分析已经成为数据科学和产品开发岗面试中不可或缺的一部分,是决定候选人够不够格的关键点。这些面试的目的是模拟公司现有的产品,测试候选人的反应能力、解决问题的能力、有效处理障碍的能力。一般来说,有三种类型的案例研究问题:

  • 产品相关型
  • 模型相关型
  • 商业相关型

让我们先从一些问题开始。注意,这些问题没有确切的正确答案,更多是为评估是否可以做出现实的假设,并在这些假设下提出解决方案。不会特别详细,本文的主要目的是提供一个大纲或要点来回答这些类型的问题。

问题1

试想你在运营一家电子商业网站,有数以百万计的产品列表,并且希望消除可能列在不同类别下重复的产品名称。举个例子,有两种不同的产品名,iPhoneX 和AppleiPhone 10(它们指的是一个东西,但为什么需要两个名字?)。

再如,亚马逊在用不同的名字销售同样的N-95口罩,例如:

  • 新冠口罩
  • N-95口罩

你的任务是将所有重复的名称改为一个公共名称。但首先,需要找出那些名称重复的产品。你将如何处理这个问题?

我的解决方案是:可以用两种方法解决这个问题。利用给定的所有产品的图像提取粒度特征,并对这些特征进行聚类。粒度这个词很重要,因为必须对特定项目的不同版本进行分类,而它们之间会有细微的差异。因此,提取底层特征是很重要的。

例如,假设只从每张图像中提取高级特征并进行聚类。算法会将所有iPhone手机聚到一个集群中,将所有三星手机聚到一个集群中,诸如此类。但是我们希望所有的iPhoneX在一个集群,其他型号一个集群。但iPhoneX和iPhone11的图像差异极小,因此必须提取颗粒特征,才能提高聚类算法的性能。

但假如面试官反驳:假如有些产品根本没有图像,那该怎么办呢?可以对每个产品的描述进行聚类,并对它们进行分类。首先对描述执行数据清理,然后使用TF-IDF或NLP中任何其他类似方法,再执行集群。
 

虽然我们清楚这些公司和他们的聪明无比的工程师未必有操纵人心的恶意,而只是有取得商业成功的动机,就会不断地加入操纵人心的技术。而这一次,工程师们有了一个最好的助手,那就是人工智能。

AI算法的最初目标一定是体现了人类的某一目的,比如在对抗学习中拿到最高的分数、在图像识别中得到最高的识别率,在偏好推荐上要不断满足用户喜好,找到尽可能多的相似内容。人工智能不仅在某些方面表现不错,而且还有了赶超人类决策的计算能力。

从“不够好”的AI到“被用坏”的AI

AI威胁论,很多人已经讲了很多次,但我们这里并不是再重复这种大众所理解的“AI统治人类”、“AI取代人类工作”的观点。因为这种观点也仿佛再说AI会成为一个独立于人的新的物种存在,而如今来看,这样的AI不知要到猴年马月才实现,或者根本无法实现。

我们这里强调的是,不同于以往任何力学的、化学的、生物的技术,仅仅提高人类的局部性的能力,这一次AI技术这次要替代的是人的感知、判断和决策能力,是对人的理性行为的一种“复刻”。

AI技术的这种“非中立”特性难免会导致以下结果:

一、AI算法在数据训练中由于模型设计和数据样本不足等问题会难以避免地出现偏见。

比如,2018年的一则报道中,亚马逊的AI招聘系统被指出系统性地歧视女性,在发现简历中出现“女性”字样就会降低应聘者的分数,而且还被发现,标注某两所女子大学的简历也会在排序上被降级。而人工智能的这一权重决策正是来自于学习了亚马逊此前10年的简历数据。

显然,这十年中,大部分被录用的候选人都是男性,人类HR在招募技术岗位上的偏好也教会了人工智能采用同样的策略。

(编辑:宜春站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读