当前位置：首页 >新媒易动态 >快手号购买

AI 开发指南：机器学习产品是什么？

2019-11-25

关于管理AI产品，我认为最重要的几件事：

机器学习（ML）产品管理比一般软件更具挑战性，因为它涉及更多的不确定性。不仅需要技术上的改变，还需要组织上的改变。
ML最适合做出决策或预测。
ML产品经理最重要的工作：明确定义问题，确定需求，设定衡量成功的标准，并为ML工程师提供足够的空间和时间探索解决方案。
从第一天就开始计划数据策略（Data Strategy）。
构建ML产品是跨领域的，不只是数据科学。

在《AI重新定义机器人》文章中，我提到了ML带来的最大不同是：

让机器从依赖人工编写程序，转向真正的自主学习。

机器不需要人工指示，而是自行根据数据中识别出的模式，进行预测和改进。这就是为什么ML特别适用于那些，以往难以明确解释定义的问题。这也代表ML可以使你的产品更个人化，更自动化，和更精确。

先进的算法，大数据，和硬件价格下降，成为ML成长的主要驱动力。

AI已在各个领域逐渐被采用。麦肯锡（Mckinsey）最近的报告中显示，近一半的公司在其研发流程中整合了AI，另外有30％的公司正在试验AI项目。

不难看出为什么，许多人预期ML将比移动技术带来更巨大的产业变革。但是，与此同时，公司引进ML的难度，也可能比当年采用移动技术更高数倍以上。为什么呢？在讨论具体原因之前，让我们先一起聊聊什么是ML。

机器学习（ML）三大类型：监督学习、无监督学习、强化学习

AI人工智能并没有一个普遍被认同的定义，而且它的定义不断在改变。一旦某项任务能够成功被机器执行，该任务就不再属于AI的范围。

ML是AI的一部分。 Carnegie Mellon大学教授汤姆· 米切尔（Tom M.Mitchell）将机器学习定义为对一种，「允许程序根据经验自动进行改进」的算法。

机器学习有三种主要类型：

监督学习（Supervised Learning）：最常见和最被广泛使用的类型。这些算法从被事先标记好的数据（labeled data）中学习，大多时候被用以预测结果。例如，给予机器大量标记好的动物图片，让机器学习判断猫和狗。
无监督学习（Unsupervised Learning）：无监督学习算法不需要事先标示，而是直接从数据学习判读模式。它可以用于聚类（clustering），关联（association）和异常检测（anomaly detection）问题。另外还有半监督学习，是监督学习与非监督学习之间的混合体。
强化学习（Reinforcement Learning）：算法藉由得到环境中的反馈而学习。 RL通常用于机器人技术，或自动驾驶汽车等控制领域。例如将目标函数（Objective Funcion）设定为「成功从A点移动到B点」，每次机器人成功到达B点，就会得到正面响应（reward），一直到重复直到机器人学会执行这项任务为止。

机器学习产品的类型

根据产品的类型和核心价值的来源，你将需要不同技能，并且专注于产品的不同面向。

用户是企业，还是一般消费者？

像Alexa或Google Assistant这样的消费性ML产品，具有更强的社交互动成分。因此，用户体验（User Experience）在设计消费类ML产品中扮演着极关键的角色，而ML技术则往往是达成更好用户体验的方式之一。

例如，NLP（自然语言处理）被用于达成Alexa及用户之间更自然的沟通。另一方面，B2B的ML产品对应的是企业，甚至是工业用户（例如用于预测工厂仪器维护时程的算法），其核心价值往往来自预测的准确性，而非UX。

这并不是说UX对面向企业的ML产品不重要。而是，当你的资源有限，并且需要集中精力优化产品的某些部分时，就需要考虑这个问题。

你要设计的是ML产品？或是将ML应用到你的产品中？

如果你产品的核心价值来自ML模型，那么你很可能正在设计一个ML产品。相反的，如果ML仅用于增强产品的用户体验或部分性能，那么你很可能正在将ML应用于产品上。

在第二种情况下，身为产品经理，你不应该花太多时间顾虑技术细节；像是「ML模型是以CNN（卷积神经网络）还是R-CNN为基础」，而是应该花时间了解模型的输入（input）和输出（output）。

举例来说，你要使用的这个ML模型，采用用户的人口统计数据（input）来预测用户在平台上的每月支出（output）？另一方面，设计ML产品通常需要PM具备更高的技术能力，以帮助团队确定关键决策和权衡取舍。

产品类型也会影响组织结构。对于研发机器学习产品的公司，或像Facebook和Google这类在ML上投入大量资金的的大型公司，通常会雇用机器学习研究人员或数据科学家，并将他们与机器学习工程师组成团队。

相反的，对于想将ML应用于其产品的公司，或资源有限的小型公司，最好的策略是雇用跨领域的ML工程师，或培训软件工程师学习ML，而不是雇用ML研究人员。

构建ML产品通常是跨领域的

研发机器学习产品很少会只涉及ML。它通常是跨领域的，不仅涉及ML模型设计及训练，还涉及软件工程，后端结构，数据分析，UX / UI设计，甚至是软硬件整合等等。

产品经理需要能够管理跨职能的团队，并处理团队之间的相互依赖和潜在冲突。 ML从根本上不同于其他学科，这点会在下一段进一步说明。如果你要设计和现实世界互动的ML产品（例如机器人技术或自动驾驶汽车），情况将变得更加复杂。

PM需要知道使用ML可以做什么，和不能做什么，何时应该使用ML和何时不应该使用ML。

其他需要理解的关键ML概念

过拟合（Overfit）

是一种常见的错误类型，当机器学习模型过于匹配特定的数据集时发生。可靠的ML模型不仅在「训练数据集」（training dataset），也在「验证数据集」（validation dataset）上表现良好。但是，在过拟合的情况下，训练数据的表现会变好，但对于没有看过的，验证数据的表现却反而会变差。

深度学习（Deep Learning）

主要用于图像分类。 DL使用深度神经网络，并以卷标图像作为输入。神经网络的每一层，都会将输入转换为稍微抽象和复合的表示形式。最终，模型将能学会识别图像中的内容。

自然语言处理（Natural Language Processing）

这是计算机科学中的一个领域，目的是使机器可以理解人类语言，但不一定涉及ML。 NLP通常用于聊天机器人、语音助手、或是预处理数据。

管理机器学习产品的挑战

实验是机器学习的关键部分

ML也会用到程序代码和数据，但若因此就认为ML与软件工程本质相同，那就大错特错了。

与软件工程不同，开发ML产品需要进行更多的实验，涉及更多的不确定性和可变性。软件工程是一个为机器编写规则的确定性过程，而机器学习则具有更高的机率性，因为它可以自行学习，而不需要我们来编写规则。

例如，如果你想教机器识别猫。透过软件工程，你可能会想出「一只猫有四只腿和两个尖尖的耳朵」这样的明确规则。

但如果使用深度学习，要做的就不是提供明确的规则。

而是为机器提供一堆猫的照片（事先标记好这些是猫的图像），然后让机器自行学习，摸索出规则。

上一篇：如何让AI机器人的对话更加自然？

下一篇：项目管理：智能硬件项目研发流程

新媒易动态