第20讲理解AI
因AI成为当今主流的智能学习工具,所以要对以往的方法进行改善。同时,通过对数据的活用,可以获得以前无法得到的答案。而且,这条道路今后很可能会有更长远的发展。那么,智能学习具体是怎样的一种方法呢?
在讲智能学习之前,首先说明一下以前是怎样对计算机发出指令的。在考虑对计算机发出指令时,有3个必要因素:输入(input),程序算法,输出(output)。
其中最重要的就是程序算法。充分考虑这个程序(程序算法),是对计算机发出指令的基础。由人去努力思考程序算法,就是一直以来使用的方法。
而另一方面,智能学习的话,作为基础的程序(程序算法)不是由人来拟定,而是由计算机通过学习后自己去拟定的。可以大致理解为,计算机根据大量的输入数据和与之对应的输出数据,计算出输入和输出之间的相关性。
这样一来,人应该做的事,就不是思考程序算法,而是准备大量的输入数据和输出数据了。在这个过程中,计算机会根据数据来找出输入和输出之间的关联性,也就是可以发现程序算法。
我们用事例来进行补充说明。
例如,假设现在要拟定一个程序算法,输入是照片,输出是表情认知,即识别照片里的脸是在生气、是在笑还是哭。
在这种情况下,如果使用以前的方法,就要对头像照片的要素进行分解,指定哪个部位应该怎样观察,在怎样的条件下判断为“在生气”,在怎样的条件下判断为“在笑”,这些都是由人来思考并拟定程序算法。
相对地,如果采用机器学习的方法,最初的一步是准备输入和输出的数据。要准备多张头像照片作为输入数据,并且判断照片里面的表情是“在生气”,还是“在笑”,或是“在哭”,作为输出的数据来使用。
也就是说,把表情作为标签和照片对应,并且,把大量头像照片和对应的照片都录入计算机。最后,计算机就会参考大量的数据,思考可以识别表情的程序算法。
在机器学习的过程中,可以通过以下步骤来让计算机思考程序算法。
1。决定什么作为输出
2。决定什么作为输入
3。准备多个输出和输入的组合
1。决定什么作为输出
刚才的例子是以脸部表情作为输出,下面我们以销售额为输出来讲解。因为销售额作为目标非常明确,而且从量化的角度来说,可以用金额来表示,是非常清晰易懂的输出。
另外,如果以“学习”为例的话,情况会怎样?以学会了或者没学会作为输出,虽然可以作为方向,但是很难找到清晰的判断标准。
以往我们会以测试的分数作为是否学会的结果指标,但测试的意义不外乎是对记忆的确认,要充分考虑好定义以及具体要如何量化。
如上所述,在实际业务中,确定以什么作为输出是最重要的工作。
需要充分考虑“这个输出是要获得什么”“这个输出可以用什么来计量”,还要考虑“怎样可以量化”。
2。决定什么作为输入
决定输出的内容以后,需要尽可能找出可能对这个输出内容产生影响的输入内容。数据越多,程序算法的精度越高。而且,对大量的数据进行处理是计算机擅长的事。因此,要有意识地找出尽可能多的可能对输出产生影响的内容。
另外,和输出一致,输入在最后也要进行量化。大家在罗列输入内容时,同时要有意识地思考如何能够进行量化。