人工智能的问题和前景：不只需要数据，更需要和人类智慧合作

人工智能 (AI) 的问题和前景是人。这一直是正确的，无论我们对机器人霸主接管的希望（和恐惧）是什么。在人工智能和更普遍的数据科学中，诀窍是融合人类和机器的优点。一段时间以来，人工智能行业的啦啦队倾向于强调等式的机器方面。但正如 Spring Health 数据科学家 Elena Dyachkova 所暗示的那样，数据（及其背后的机器）只有在解读数据的人是否聪明时才有用。换句话说，数据不是自我解释的，而是需要人类的智慧和判断来赋予它意义和价值。

Dyachkova 正在回复 Amplify Partners 的普通合伙人和 Mattermark 前数据主管 Sarah Catanzaro 的评论。在讨论不完善的数据和分析在决策制定中的效用时，Catanzaro 说，“我认为数据社区常常忽略了有缺陷但方向正确的报告和分析的价值。”然后她继续争辩说，“许多决定不需要高精度的洞察力；在许多情况下，我们不应该回避快速和肮脏的事情。”这是一个很好的提醒，我们不需要完美的数据来做出决定。事实上，追求完美可能会导致分析瘫痪，浪费时间和资源，而错过重要的机会。

那挺好的。 Gary Marcus 是 Geometric Intelligence 的科学家和创始人，Geometric Intelligence 是一家机器学习公司，于 2016 年被 Uber 收购，他坚持认为，欣赏 AI 及其子集机器学习和深度学习的关键是认识到这种模式识别工具处于“最佳状态”当我们需要的只是粗略的结果时，赌注很低，完美的结果是可选的。”尽管如此，在我们寻求更强大的 AI 驱动的应用程序的过程中，我们一直在寻找越来越多的数据，期望只要有足够的数据，机器学习模型就会以某种方式为我们提供比“粗略的结果”更好的结果。唉!它在现实世界中根本行不通。

虽然更多的数据可能很好，但对于许多应用程序来说，我们并不需要更多的数据。相反，我们需要人们更好地理解我们已有的数据。正如 Dyachkova 指出的那样，“产品分析 80% 是快速而肮脏的。但是判断什么时候快和脏是合适的能力需要对统计数据有很好的理解。”了解？ Indeed.com 的数据科学家文森特道林 (Vincent Dowling) 更清楚地说明了这一点：“成为一名经验丰富的分析师/科学家的很多价值在于确定做出决定所需的严谨程度。”他们都在谈论如何做出决策，在这两种情况下，查看数据的人的体验比数据本身更重要。机器永远无法弥补操作它们的人的悟性不足。正如《卫报》的一篇社论所言，“人工智能的前景在于，它将赋予机器从数据中发现模式的能力，并比人类更快更好地做出决策。如果他们更快地做出更糟糕的决定会怎样？”这是一个非常现实的可能性，如果人们放弃所有权，认为数据和机器会以某种方式为自己说话。这也是一个非常危险的可能性，如果我们不考虑数据和算法可能存在的偏见、错误和限制。

让人们负责在实践中并不是那么容易实现的。正如 Gartner Research 副总裁 Manjunath Bhat 所说，人工智能受人类输入的影响，包括我们选择输入机器的数据。反过来，我们算法的结果会影响我们做出决策所依据的数据。 “人们以数据的形式消费事实。然而，数据可以被突变、转换和更改——所有这些都是为了使其易于使用。我们别无选择，只能生活在高度情境化的世界观范围内。”亚马逊应用科学家 Eugene Yan 认为，对于一个成功的机器学习项目，“你需要数据。您需要一个强大的管道来支持您的数据流。最重要的是，你需要高质量的标签。”但如果没有经验丰富的人，就无法正确标记这些数据。要很好地标记它，您需要了解数据。这让人回想起十年前 Gartner 分析师 Svetlana Sicular 提出的观点：企业中到处都是了解其业务细微差别的人。他们最有能力针对公司的数据找出正确的问题类型。他们可能缺乏的是 Dyachkova 指出的对统计、数学和特定公司业务的基本理解——知道什么时候“足够好”的结果实际上足够好的能力。

当然，这就是数据科学困难的原因。在每项关于采用 AI/ML 的主要障碍的调查中，“人才”总是位居榜首。有时我们认为这是因为数据科学人才短缺，但也许我们应该担心缺乏对统计、数学和特定公司业务的基本理解。或者更准确地说，我们应该担心缺乏能够沟通、合作和教育其他人这些基本理解的人才。数据科学不是一个孤立或专门化的领域，而是一个需要跨部门和跨职能协作和共享知识和见解的领域。因此，我们需要培养那些不仅擅长处理数据和机器，而且擅长与其他人交流和合作的人才。