AI产品经理入门实例讲解

Need编辑
3346 阅读
1


背景说明


在机器学习大数据日新月异的时代里,从拉新运营到网红短视频运营,从SEM再到精准推荐,精准推荐开启了产品运营的智领革新,智在运营的新征程。

文章以产品经理应该懂哪些精准推荐算法模型为主线,顺道在上篇中先将算法按照机器学习风格进行划分;下篇按照功能相似性进行划分,从产品经理必懂的精准推荐算法模型展开,实证传统算法模型对产品精准推荐的功用和缺陷,然后总结出一套AI-UTAUT模型,即整合AI技术精准推荐模型供读者落地具体产品实战参考。

即本篇希望以精准推荐模型为案例通过全面的撰写将AI产品经理需要懂的算法和模型进行了系统的入门讲解。

另外笔者在撰文之前先说明:一个产品经理经常疑惑的概念:算法和模型的关系,产品经理懂得解决问题时将问题抽象为模型,对模型求解用算法,没有谁大谁小,算法和模型没有绝对的分界线。

首先我们看用于精准推荐的算法模型有哪些,这些模型算法各有优缺点,然后笔者根据实战下来,创造性的总结了一套AI-UTAUT模型。



一、精准推荐算法模型


精准推荐中的常用模型有:交叉销售模型、关联推荐匹配模型、互联网信用模型、电商动态定价模型、信息聚合分类模型等等。

文中尽量不采用高等数学公式,尽量用直白的产品经理听得懂的语言进行讲述,因为公式可以在产品具体业务落地的过程中根据所需要公式有选择的进行针对的学习。

1. 交叉销售模型

利用关联规则发现两个产品间潜在的相关性,进而进行捆绑与推荐;关联规则可用Apriori等算法实现,交叉销售通过研究客户的产品使用情况,消费行为特点,发现老客户的潜在需求,一方面通过产品之间的关联,寻找实现产品捆绑销售的机会,另一方面为新产品寻找已有用户中的精准目标群体。

建立模型的具体步骤为:

(1)以个体用户为单元,收集其订购业务种类,计算其订购比例;

(2)提取订购比例较高的几类业务,计算不同业务两两间的相关性,分组、筛选与分类;

(3)针对相关性和替代性高的业务组合进行交叉销售,如绑定销售精确推荐。

Apriori 算法:

Apriori 算法被用来在交易数据库中进行挖掘频繁的子集,然后生成关联规则。常用于市场篮子分析,分析数据库中最常同时出现的交易。通常,如果一个顾客购买了商品 X 之后又购买了商品 Y,那么这个关联规则就可以写为:X -> Y。

例如:如果一位顾客购买了牛奶和甜糖,那他很有可能还会购买咖啡粉。这个可以写成这样的关联规则: -> 咖啡粉。关联规则是交叉了支持度(support)和置信度(confidence)的阈值之后产生的。

支持度的程度帮助修改在频繁的项目集中用来作为候选项目集的数量。这种支持度的衡量是由 Apriori 原则来指导的。

Apriori 原则说明:如果一个项目集是频繁的,那么它的所有子集都是频繁的。

2. 关联推荐匹配模型

关联推荐匹配模型着眼于用户数据的基础属性、媒体属性等,实现产品精准定位,在广告的定向投放上效果显著。

建立该模型需要采集的用户数据有基础属性数据如性别、年龄、收入、学历;环境属性数据如手机上网时间、城市、地点、系统平台、语言环境;媒体属性数据如浏览的媒体、浏览的内容、兴趣关注点、当前的需求;消费属性数据如关注品牌、关注产品、消费水平、消费心态等。

AI技术使得社交网络数据深度挖掘成为可能,运用计算机智能,通过社交网络API获取用户授权数据,进而对用户数据进行学习和解析,再通过数据挖掘进行建模与推荐(数据量更大);完全的个性化分析可以提供最有价值的产品,例如 APPhero, 经由社交网络数据深挖掘,使用 FACEBOOK 的数据,让这些数据成为推荐的基准。

AppHero 会对用户异常熟悉,它会将用户在 Facebook 上做过的事,包括评论和评论中的嵌套、喜欢的页面、用户分享的东西、个人档案的数据、兴趣、所在地等等通通收进算法模型。

关联推荐模型图示如下:



关联推荐模型中,关联规则学习方法提取规则,此模型可以完美的解释数据中变量之间的关系。这些规则可以在大型多维数据集中被发现是非常重要的。最流行的关联规则学习算法是:Apriori算法;上文已经介绍过Apriori算法。

3. 互联网信用模型

传统通用模型存在环境因素难确定,属性单一等缺点,而卖家间的差异巨大;基于APRIORI算法建立互联网信用模型,更准确,并可预测信用趋势,数据变换(文字评价转变为数字).

ARRIORI算法挖掘关联生成关联规则,得出:信用值与好评率、行业、性别、违规操作数、婚否、地区、卖家级别、收入、逾期坏账次数相关,按照笔者LineLian曾经服务过的阿里淘宝网的交易模式来看,信用模型同样可以用于买家,实现买卖双方的公平对等;电信行业也可以参考信用卡模式度,对用户进行信用监管,移动的客户中,曾经有月贡献1000元左右的全球通高端客户因为欠费0.7元而被停机,导致其离网的先例,以信用卡模式建立的基于AI技术的电信行业用户信用管理,仿照信用卡模式对客户授予一定的话费透支额度,与用户信用度相关联;同时也可以对透支部分的消费加收额外费用扩大电信服务产品的差异化定价。

4. 电商动态定价模型

传统动态定价方法以拍卖为主,很难收集客户信息;基于AI技术中机器学习算法的电商动态定价模型则可以充分收集交易数据,并能通过机器学习中无监督的自学习对价格进行调整。

电子商务通用信用模型的缺点主要有:卖家很难搜集全面的客户竞争对手信息,不能对其进行深度挖掘;不能依据客户特征进行差别化定价,也做不到对不同的商品做出及时适当的加价幅度的调整;当需求量具有随机性和价格敏感性时,动态定价就成为使利润最大化的有效方法。

机器学习算法简介:

有两种方法可以对产品经理现在遇到的所有机器学习算法进行分类:

第一种算法分组是学习风格的。

第二种算法分组是通过形式或功能相似。通常,这两种方法都能概括全部的算法。

通过学习风格分组的机器学习算法,机器学习算法中有三种不同学习方式:

第一叫监督学习:

基本上,在监督机器学习中,输入数据被称为训练数据,并且具有已知的标签或结果,例如垃圾邮件/非垃圾邮件或股票价格。在此,通过训练过程中准备模型。此外,还需要做出预测。并且在这些预测错误时予以纠正。训练过程一直持续到模型达到所需水平。

示例问题:分类和回归。

示例算法:逻辑回归和反向传播神经网络。

第二叫无监督学习:

在无监督机器学习中,输入数据未标记且没有已知结果。我们必须通过推导输入数据中存在的结构来准备模型。这可能是提取一般规则,但是我们可以通过数学过程来减少冗余。

示例问题:聚类,降维和关联规则学习。

示例算法:Apriori算法和k-Means。

第三叫半监督学习:

输入数据是标记和未标记示例的混合。存在期望的预测问题,但该模型必须学习组织数据以及进行预测的结构。

示例问题:分类和回归。

示例算法:其他灵活方法的扩展。

其他根据功能相似性讲算法进行划分的方法将在下一篇文章中进行讲述,本文综合从学习风格上进行划分,并主要讲跟精准推荐相关的算法模型。

电商动态定价模型举例:携程大数据杀熟背后的算法模型!大数据杀熟,即同一件商品或者同一项服务,互联网厂商显示给老用户的价格要高于新用户。大数据能杀熟的基础是海量用户数据。如上文所述企业一般会在后台抓取用户的消费记录,通过用户行为判断其偏好和消费意愿强烈程度。如果企业发现你是一个对价格不敏感的用户,就会调高价格,减少优惠比例。

首先,通过你的基础属性数据判断你所在的用户群体、人群特征(如消费能力),通过你的行为数据判断你的偏好和消费意愿强烈程度。综合分析后,判断出你是谁,你现在要做什么,愿意付出多少代价去做。最后,企业根据精准的用户画像,去对消费能力高、消费意愿强烈的用户展示更多的价格、赚取更多的利润。

本文支招阅读了此文的读者防杀熟的方法:

第一,可以进行一些伴随搜索,故意混淆AI;

第二、必要时关掉App数据许可;

第三、关掉定位许可;

第四、关闭Wi-Fi自动连接等;

第五、重新注册一个新账号登录,平台方往往会为了留住新用户而给新用户薅羊毛的机遇。

5. 信息聚合分类模型

信息杂志化是近年来的发展趋势,杂志化阅读一方面将社交网站集成一体,个性化定制界面使信息获取更方便;但杂志化阅读应用诸如 Flipboard 并不具备个体社交网络软件的很多功能,因此其必须要主打方便和效率;但目前为止其模式知识简单的“搬运”。

但杂志化并不意味着信息大杂烩,对信息进行聚合分类可以大大提升阅读效率,大数据与Flipboard模式的结合可以很好地解决这一问题,通过社交网站数据的采集并进行特征归类,自动将每一条信息划归最合适的分类区,大大提高了阅读效率,该模型还可以定期对数据进行自学习与更新,产生新的分类建议。

大量数据不仅可以通过AI技术建立模型供企业/卖家进行内部分析,也可以通过合法交易供其他企业/卖家使用,数据提供者不仅可以从中获益,数据本身也能创造更多价值,在电视广告领域,总部设在纽约的Nielsen 已经连续十多年为广告主以及电视台提供了相关数据。

下图为头条通过AI技术提取内容特征自动将每一条信息划归最合适的分类区然后精准推荐给对此特征感性趣的读者的例子:





二、了解机器算法



接下来我们从时下各种算法模型用于精准推荐都有其各自的优点和缺点带出我自创的精准推荐模型AI-UTAUT模型和实例解析,顺道讲解从算法模型功能的相似性的角度为入门AI产品经理的同学讲解算法模型的另外一个维度。


1、传统的UTAUT推荐模型

什么叫UTAUT,传统上UTAUT指的是整合型科技接受模式,即通过这个模型各个因子来观察精准推荐模型中用户的接受意愿。

整合技术接受与使用模型(Unified theory of Acceptance and Use of Technology,简称UTAUT)是由 Venkatesh and Davis 文卡塔什和戴维斯整合了技术适配模型(Task techfit,TTF)、理性行为理论(Theory of Reasoned Action,TRA)、计划行为理论(Throry of Planned Behavior,TPB)、创新扩散理论(InnovationDiffusionTheory,IDT)、社会认知理论(SocialCongnitive Theory,SCT)、PC利用模型(Model of PCU tilization,MPCU)、复合 TAM&TPB模型(Combined TAM and TPB,C&TAM&TPB)、动机模型(Motivational model,MM),提炼出了四个核心变量和四个控制变量。

四个核心变量是:努力期望(Effort Expectancy)、绩效期望(PerformanceExpectancy)、社会影响(Social influence)和便利条件(Facilitating Condition)。

四个控制变量是:年龄、性别、经验和自愿性。

如下图所示:



在需多大厂的产品经理中经常采用UTAUT模型来做精准推荐模型因子分析。因为每一个网络用户的生活轨迹都被互联网忠实地记录着,网络服务商抓取与挖掘了这些轨迹,形成“数据痕迹”,堪称“大数据”。

根据这些大数据,产品运营可以对消费者的兴趣爱好、购买行为进行科学的分析和预测,透过大数据找到商业价值,从而向消费者进行精准定向推荐。虽然产品运营利用大数据实施精准推荐后,大幅提升了营销效果,改变了企业“知晓浪费了50%的广告费,却不知晓哪50%被浪费”的尴尬局面,但运营的精准推荐不仅给用户带来了“确实想要的东西”,也带来了垃圾信息、无用信息,既给用户带来了便利又造成了困扰。

因此,产品运营用大数据精准推荐信息推送的结果是,并不是所有接触到精准推荐信息的用户都会接受并采取购买产品的行动。消费者对大数据精准推荐的接受意愿的影响因素有哪些?UTAUT模型回答了一部分,但是也不充足。

原来的UTAUT模型在时下的产品运营需求中问题如下:

其一,UTAUT模型对便利条件依赖占据1/4这是无必要的,因为产品运营用大数据精准推荐是通过手机短信、电子邮件广告、搜索引擎、个性化引擎推荐、门户网站、微信、微博、竞价排名搜索、关键词搜索广告、点告、窄告等工具向消费者进行精准信息推送的,而当今社会,智能手机和 PC机已经进入千家万户,所以消费者可以借助智能手机和 PC机接收企业向自己推送的精准营销信息,便利性不存在问题。

其二,过于依赖年龄结构因素,我国网民的年龄结构依然偏向年轻,以10~39岁群体为主,占整体的72.1%。因此,产品的大数据精准营销的主要对象以年轻人为主。

其三,给予性别因子的比重过高,在我的新AI-UTAUT模型中是权重降低的,原因是由于产品运营大数据精准推荐的特点是在合适的时间、合适的地点,凭借合适的媒介,通过合适的渠道,将合适的商品销售给合适的消费者,因此,只要企业大数据推送的信息是精准的,无论男女,皆能接受。

2、创新的AI-UTAUT模型-以AI新零售企业为例

先介绍一下投资的这家企业的产品形态,这家企业有线下部分职能零售店,也有线上部分软件产品包含,小程序APP、ERP、CRM等系统产品。特别介绍一下这家产品的场景是在地铁和地铁站附近的大型ShoppingMall。用户主要是居住工作在城市的白领为主。

精准推荐的目标是:用自有的用户为基础数据训练算法模型,这个模型是当用户到达某个兴趣点位附近时可以精准为其希望搜索到的品牌恰巧运用系统推荐用户感兴趣的品牌,这个模型暂时命名为AILBA。

1)模型构建

利用AI技术整合UTAUT模型与4C理论的接受意愿影响因素模型,虽然UTAUT模型被普遍地应用于技术接受因素的研究,但对于大多数实际情况下———用户对大数据精准推荐的接受意愿的影响因素,其不仅受模型中因素的影响,还受消费者需求是否得以满足的影响。

因此,在模型设计过程中,我为所投资的企业产品搭建了AI技术为引擎以UTAUT模型为框架,结合4C理论,加以修改,构建整合了AI-UTAUT模型以期待该模型精准的为用户推荐符合消费者需求的产品。模型如下图:



2) 模型解释

该模型主要工作站是推荐引擎和人工规则,推荐引擎中所用的算法将在下一个段落根据算法的功能相似性一节里面细讲。

场景数据是指用户所处的环境例如用户刚刚下地铁,用户刚刚在某个购物中心某家店有过消费过某个商品A,根据上篇讲述的交叉关联销售可以为用户推荐关联商品B。

用户画像人人都在说,用户画像贵在准。

广义上,” 用户画像 ” 指的是企业从各个渠道收集用户信息,再根据所获信息对用户进行人格化分析,包括人口属性、兴趣爱好、购物偏好、社交属性等等,为每一位用户打上专属标签。

用户画像的分析维度:

其一、人口属性:

地域、年龄、性别、文化、职业、收入、生活习惯、消费习惯等;

其二、产品行为:

产品类别、活跃频率、停留时间、问题咨询、产品喜好、产品驱动、使用习惯、产品消费等;

用户画像对精准推荐的好处,随着移动互联网的发展,各类手机应用的频繁使用,用户的时间越来越趋于碎片化,各维度的信息也更丰富,移动应用开发者们也从以技术为中心的产品设计渐渐转向了以用户为中心。

对用户的精准画像,一方面可以很好地描述用户的许多特征,有助于产品人员展开针对性的设计产品;另一方面,对运营人员开展精准化营销、个性化推荐也起到了至关重要的作用。

如今,”用户画像”被越来越多的谈及,它是产品经理、运营者们津津乐道的宝贝。作为销售员们喜爱的一款工具,我们来看看我所投资企业人工智能推荐引擎是如何进行用户画像,帮助企业实现精准营销的。

企业管理者或销售人员借助我搭建的AI-UTAUT模型,便能够实时获取客户的信息和行为轨迹,包括他们的基本特征、联系方式,他们浏览过哪个页面,他们喜欢点击、分享怎样的内容,他们会咨询什么样的问题。

AI-UTAUT模型还能实时把客户的行为与销售员进行关联,例如一旦监测到客户点击小程序中的任何页面,即会通知销售人员,帮助销售获取潜在客户,实现标签化管理。销售员还可以与客户发微信消息,而且无需加好友、不用跳转,即可随心实现。

根据客户的行为分析,AI-UTAUT模型运用独特的人工智能算法,可以自动生成成交几率预测,以漏斗图的形式,把客户按照成功率由高往低排,让销售员一眼便能知道谁才是潜在用户,避免销售人员多做无用功。

例如,某汽车4S店销售员小王周一上午到达公司后,第一件事就是打开自己的微信,这时他看到AI-UTAUT模型助理已经推送了几十条销售线索。当他点开”客户”,可以查看AI所分析的预计成功率,并且系统已经自动按成功率高低排出客户的优先级。

这时系统显示一位叫阿莲的女士的预计成交率在85%,她留言询问某款SUV是否有更紧凑的型号,小王立马进行回复。5分钟后,他的手机铃声响起,来电显示正是阿莲。短短5分钟,一笔20万以上的业务就被敲定了。

此外,用户画像除了在沟通和识别客户方面有帮助外,还能对维系老客户和促进二次转化,发挥更多价值。

例如,我们还可以在AI-UTAUT后台选取一批用户的某些属性,做一些预测功能,例如预测用户是否会流失;或者预测用户是否会对新上线的功能感兴趣。对应的,预测出很可能会流失的用户,针对性进行挽留的营销活动,比如发红包、发优惠券等。针对会对新功能感兴趣的用户,可以给其推送新功能,来增加用户的粘性。

我所搭建的AI-UTAUT模型在所投资的这家正好解决了原来商家的优惠券使用率低、用户粘性低的问题。

综合来看AI-UTAUT模型不仅仅帮我所投资的这家企业的销售额提升,同时这套模型算法也为周边的商家进行了赋能。例如上文中所举的例子赋能4S点销售人员更好的服务客户的例子。

3、AI-UTAUT模型深度解析

1)模型中的绩效期望因素

绩效期望正向影响消费者接受企业大数据精准推荐意愿是因为消费者接受企业大数据精准推荐的信息有可能提高其信息搜索的效率。企业要推送切实满足消费者需求的信息,企业就必须做好消费者画像的识别工作,完善数据分析推荐模型,及时根据消费者多元、动态、不可持续的需求进行数据推荐模型的完善和修正,做好消费者画像特征分析工作,保证向消费者推送的信息是消费者需求的,真真正正地提高消费者信息搜索的效率。

2) 模型中的基于消费者需求和期望的信息方面

基于消费者需求和期望的信息正向影响消费者接受企业大数据精准推荐意愿是因为基于消费者需求和期望的信息是适当的、准确的、有质量的信息。企业要根据消费者经浏览、访问、购买形成的各式大数据进行细致分析,洞察消费者的显性需求和潜在需求,做好消费者产品喜好、心理接受价位、产品品牌等信息的预测,及时地以合适的方式,在合适的时间,将合适的产品信息推送给消费者,提高消费者和产品的匹配度,提高消费者转化率。

3) 模型中在线及时沟通方面

在线沟通正向影响消费者接受企业大数据精准营销意愿是因为在线沟通能缩短消费者与企业人员的沟通距离,在避免向消费者单向推销,令消费者反感的同时,还可以让消费者互相了解购后感受,降低信息不对称给消费者带来的负面影响的概率。

企业要搭建营销全过程的消费者参与互动平台。企业可通过微博、微信与消费者进行互动,也可通过设置商品评价区、讨论区让消费者留言,在及时了解消费者对企业产品或服务评价的同时,也可为企业产品或服务营造良好的口碑。

当然,消费者对企业的产品或服务不满意时,也可通过互动平台及时反馈,企业也可及时处理,降低不良口碑对企业的影响。企业还可鼓励喜欢购后分享、有公众影响力的消费者进行分享,以期带动其他消费者选择企业的产品或服务。

我利用AI-UTAUT模型所赋能的地铁新零售企业旗下的一类是智能贩售机,我建议厂家在机器上安装一键在线沟通功能,就是为了上述原因。

企业在开展精准推荐的过程中,若企业人员能与消费者进行沟通,就可将单向促销转换为“互动、双赢、关联关系”的沟通,最大化地缩短了企业和消费者间的沟通距离,避免一味地向消费者进行单向推销,在无法触及消费者需求点的情况下,使消费者产生反感、抵触的情绪。

当然,企业开展的大数据精准推荐并不是一次性的活动,而是一个循环往复的过程,企业人员在与消费者周而复始的沟通中能不断地收集消费者的信息,对自身的精准推荐模型算法不断调整和优化,进而提升消费者接受企业大数据精准推荐的意愿,提升对企业产品或服务的购买意愿。

4、设计AI-UTAUT模型时所研究过的算法模型

算法模型在《AI产品经理从懂精准推荐模型到产品创新》上篇中按AI机器学习风格进行过分类,者下篇中我们将按功能相似性讲解算法模型,这里所讲解的模型算法是我在创造AI-UTAUT模型过程中多数检验过的。所以在讲解算法模型的时候会总结哪些算法模型用在哪个场景比较多,哪些算法模型是AI产品经理经常会遇到的。

由功能的相似性分组的算法模型如下:

机器学习算法通常根据其功能的相似性进行分组。例如,基于树的方法以及神经网络的方法。但是,仍有算法可以轻松适应多个类别。如学习矢量量化,这是一个神经网络方法和基于实例的方法。

在读者阅读本段文字的时候如果有些属于不太熟悉,或者有些模型算法听到的比较少请不用担心,一方面可能是这类算法模型以后也很好用,如果需要用到的话,到时候再针对性的学习这类算法模型也不迟。另外一方面我会尽量指明这些算法应用的场景。

1)回归算法

回归算法涉及对变量之间的关系进行建模,我们在使用模型进行的预测中产生的错误度量来改进。这些方法是数据统计的主力,所以回归算法又称为回归分析。此外,它们也已被选入统计机器学习。

常用的的回归算法是:

普通最小二乘回归(OLSR);

线性回归;

Logistic回归;

逐步回归;

多元自适应回归样条(MARS);

局部估计的散点图平滑(LOESS);

用途场景:预测未来,预测销量等等。

例子:如下图:当一天中早高峰或者晚高峰的时候实际上是商场里面的品牌商销量减少的时候,这一点可以通过我的AI-UTAUT模型数据实证。



2.)基于实例的算法

该类算法是解决实例训练数据的决策问题。这些方法构建了示例数据的数据库,它需要将新数据与数据库进行比较。为了比较,我们使用相似性度量来找到最佳匹配并进行预测。出于这个原因,基于实例的方法也称为赢者通吃方法和基于记忆的学习,重点放在存储实例的表示上。因此,在实例之间使用相似性度量。

常用的基于实例的算法是:

k-最近邻(kNN);

学习矢量量化(LVQ);

自组织特征映射(SOM);

本地加权学习(LWL);

正则化算法;

用途场景:商品上新双11前夕高达千万级。因为第三方POP商品上新没有人工审核环节,商会有意、无意地将商品发布到错误类目,更有甚者,部分商家采用批量上新和批量搬家工具,导致大规模错挂商品的出现,不断冲击着商品生态防线,影响用户购物体验,并带来了诸如食品、药品和成人用品等相关的一系列监管风险。

面对海量级的商品数据和高达上千个类目的商品层级分类体系,如何才能有效判别商品类目挂靠的正确与否,实现全方位和高效的监控。

在商品类目预测这个问题上,很多电商公司在过去的10年里一直在不断探索和改进,公开资料显示,电商巨头eBay先后采用了传统的规则和统计等模型、如KNN、KNN+SLM和DNN几种方法,准确率从最初的50%一步步提高到了90%+。

3.)决策树算法

决策树方法用于构建决策模型,这是基于数据属性的实际值。决策在树结构中进行分叉,直到对给定记录做出预测决定。决策树通常快速准确,这也是机器学习从业者的最爱的算法。

常用的的决策树算法是:

分类和回归树(CART);

迭代Dichotomiser 3(ID3);

C4.5和C5.0;

卡方自动交互检测(CHAID);

决策树桩;

M5;

条件决策树;

用途场景:有一个经典的案例判断一个西瓜是否是好瓜就是典型的决策树算法模型的应用。

例子如下图:



上图说明:

有一个最直观的解释,如果你吃的大部分的好瓜纹理都很清晰,那么你肯定首先去判断面前的瓜纹理是不是清晰,如果不清晰那极有可能不是好瓜。但是还有一个问题,好瓜大都纹理清晰,但并不是所有纹理清晰的瓜都是好瓜,你需要继续根据其他特征去判断。

假设你面前的瓜纹理清晰,那么你回去想你吃过的纹理清晰的好瓜中,还有什么让你印象深刻的特征?对了,你想起来根蒂蜷缩的纹理清晰的瓜是大都是好瓜。

上面我们讲过了怎么判断一个瓜是好瓜。如果让计算机去学习如何判断好瓜,那么我们需要给它很多的样例。这些样例数据中,有好瓜有坏瓜,每个样例都给出了瓜的纹理、根蒂、色泽、触感、敲声等等特征。有了样例数据,计算机如何得到一个像人类判断过程中的那种顺序判断的思路呢?答案就是决策树。

4.)贝叶斯算法

这些方法适用于贝叶斯定理的问题,如分类和回归。

常用的贝叶斯算法是:

朴素贝叶斯;

高斯朴素贝叶斯;

多项朴素贝叶斯;

平均一依赖估计量(AODE);

贝叶斯信念网络(BBN);

贝叶斯网络(BN);

用途场景:例如判断网络环境是否异常,使用无监督学习获得每个设备、每个人员的网络行为模式,结合行为分析与高等数学,运用递归贝叶斯估计(Recursive Bayesian Estimation,RBE)理论,提供对事件的估计概率并随着新特征的发现不断更新,自动判断网络行为是否存在异常。

5)聚类算法

几乎所有的聚类算法都涉及使用数据中的固有结构,这需要将数据最佳地组织成最大共性的组。

常用的聚类算法是:

K-均值;

K-平均;

期望最大化(EM);

分层聚类;

用途场景:在用机器做聚类学习的时候,我们每种算法都对应有相应的计算原则,可以把输入的各种看上去彼此“相近”的向量分在一个群组中。然后下一步,人们通常更有针对性地去研究每一组聚在一起的对象所拥有的共性以及那些远离各个群组的孤立点——这种孤立点研究在刑侦、特殊疾病排查和用户群体划分等方面都有应用。

6)关联规则学习算法

关联规则学习方法提取规则,它可以完美的解释数据中变量之间的关系。这些规则可以在大型多维数据集中被发现是非常重要的。

常用的关联规则学习算法是:

Apriori算法;

Eclat算法;

用途场景:在《 AI产品经理从懂精准推荐模型到产品创新》上篇中讲述比较多,感兴趣的读者可以翻阅。

7)人工神经网络算法

这些算法模型大多受到生物神经网络结构的启发。它们可以是一类模式匹配,可以被用于回归和分类问题。它拥有一个巨大的子领域,因为它拥有数百种算法和变体。

常用的人工神经网络算法是:

感知机;

反向传播;

Hopfield神经网络;

径向基函数神经网络(RBFN);

用途场景:使用神经网络算法从用户的自拍中完成人脸识别,并自动抠出轮廓,并根据本地算法,将自拍快速转变为动画风格或其它自定义风格的表情包。

8)深度学习算法

深度学习算法是人工神经网络的更新,同时深度学习算法也是机器学习的典型代表算法。他们更关心构建更大更复杂的神经网络。

常用的深度学习算法是:

深玻尔兹曼机(DBM);

深信仰网络(DBN);

卷积神经网络(CNN);

堆叠式自动编码器;

用途场景:非常多,有医疗影像识别、食品配料识别,人脸识别等等。

9)常用机器学习算法列表

朴素贝叶斯分类器机器学习算法

应用场景:通常,网页、文档和电子邮件进行分类将是困难且不可能的。这就是朴素贝叶斯分类器机器学习算法的用武之地。分类器其实是一个分配总体元素值的函数。例如,垃圾邮件过滤是朴素贝叶斯算法的一种流行应用。因此,垃圾邮件过滤器是一种分类器,可为所有电子邮件分配标签“垃圾邮件”或“非垃圾邮件”。基本上,它是按照相似性分组的最流行的学习方法之一。这适用于流行的贝叶斯概率定理。

K-means:聚类机器学习算法

通常,K-means是用于聚类分析的无监督机器学习算法。此外,K-Means是一种非确定性和迭代方法,该算法通过预定数量的簇k对给定数据集进行操作。因此,K-Means算法的输出是具有在簇之间分离的输入数据的k个簇。

支持向量机学习算法

基本上,它是用于分类或回归问题的监督机器学习算法。SVM从数据集学习,这样SVM就可以对任何新数据进行分类。此外,它的工作原理是通过查找将数据分类到不同的类中。我们用它来将训练数据集分成几类。而且,有许多这样的线性超平面,SVM试图最大化各种类之间的距离,这被称为边际最大化。SVM分为两类:线性SVM:在线性SVM中,训练数据必须通过超平面分离分类器。非线性SVM:在非线性SVM中,不可能使用超平面分离训练数据。

Apriori机器学习算法

这是一种无监督的机器学习算法。我们用来从给定的数据集生成关联规则。关联规则意味着如果发生项目A,则项目B也以一定概率发生,生成的大多数关联规则都是IF_THEN格式。

应用场景:例如,如果人们购买iPad,那么他们也会购买iPad保护套来保护它。Apriori机器学习算法工作的基本原理:如果项目集频繁出现,则项目集的所有子集也经常出现。

线性回归机器学习算法

它显示了2个变量之间的关系,它显示了一个变量的变化如何影响另一个变量。

决策树机器学习算法

决策树是图形表示,它利用分支方法来举例说明决策的所有可能结果。在决策树中,内部节点表示对属性的测试。因为树的每个分支代表测试的结果,并且叶节点表示特定的类标签,即在计算所有属性后做出的决定。此外,我们必须通过从根节点到叶节点的路径来表示分类。

随机森林机器学习算法

它是首选的机器学习算法。我们使用套袋方法创建一堆具有随机数据子集的决策树。我们必须在数据集的随机样本上多次训练模型,因为我们需要从随机森林算法中获得良好的预测性能。此外,在这种集成学习方法中,我们必须组合所有决策树的输出,做出最后的预测。此外,我们通过轮询每个决策树的结果来推导出最终预测。

Logistic回归机器学习算法

这个算法的名称可能有点令人困惑,Logistic回归算法用于分类任务而不是回归问题。此外,这里的名称“回归”意味着线性模型适合于特征空间。该算法将逻辑函数应用于特征的线性组合,这需要预测分类因变量的结果。


小结


我搭建的AI-UTAUT精准推荐模型有Apriori算法、神经网络算法、回归算法、聚类算法、贝叶斯算法,预测销量的有回归算法,可以直接调用的有外面成熟的人脸识别算法、语音识别算法等。

产品经理日常工作中最常用的算法是:Apriori算法、聚类模型、决策模型、贝叶斯算法、关联规则算法和深度学习、机器学习等。

五、AI产品经理入门标准和入门类型

AI产品经理入门前提条件主要是基于有哪些类别的企业,时下和未来的一段时间AI企业主要有:

第一类是纯粹的AI技术企业,

第二类是+AI的企业,

第三类是综合型企业AI作为助推器型的企业。

AI产品经理在第一类企业里面做AI产品经理如果产品是AI算法本身,即例如你要输出的产品是人脸识别系统,这个时候需要AI产品经理对算法懂的要深刻一些,建议加入此类企业的产品朋友可以针对性的补充算法知识。

如果在这类企业里面从事的是AI+的工作,那么主要的重点可以放在为这类AI系统找到适合的应用场景,并占领市场先机,先研发出来可以落地的产品。

AI产品经理在第二类企业里面更多的是基于行业经验,看到行业内部可以被AI取代或者提升效率的点,+上AI。为行业赋能。

第三类综合性企业主要是BAT/TMD等大型科技网络公司,也包含中国平安、招行银行等国营企事业单位。这类企业往往既有自己的核心算法,同时有希望旗下细分业务+上AI。

建议加入此类公司或者单位的AI产品经理可以从数据型AI产品经理做起,因为我们都知道AI包含数据、算法、算力,而大型企业核心需求是打通数据竖井,将历史上累计的大数据用好,用AI技术得到更好的运用,所以AI产品经理可以适当补充数据分析方面的知识。