3。准备多个输出和输入的组合
输出和输入确定以后,最后一步就是准备多个这种数据的组合,把这些数据录入计算机。
现在需要的是,输入和输出的大量数据。如果输入的数据和输出的数据都已经齐全了,就没问题;另外,如果在某些地方已经存在这些信息,只要收集过来即可。
另一方面,如果需要重新收集数据,以后是否能够固定地获取数据也要一并考虑。
练习题
你在人才培养公司工作,主要负责邀请社会人士来听本公司的讲座。上司交代你,希望能够使用AI进行判断,向有意愿听讲座的人员推荐合适的讲座。你的手上有过往的实际数据,知道什么讲座比较受哪一类人群欢迎。
你考虑制作AI程序,以什么讲座受欢迎(推荐什么比较合适)作为输出,那么什么内容可以作为输入呢?请思考几个可能与推荐讲座有关系的因素。
解答
与所属企业有关的信息可能有行业、职位、部门、企业规模,与听讲座的人有关的信息可能有年龄层、性别等。
例如,如果收集到了以下关于输入和输出的数据,就要以输入数据和输出数据组合的形式来录入计算机。
这样的话,把行业、职位、部门、企业规模、讲座购买者的年龄作为输入数据录入后,计算机就会根据对过往实际数据进行学习的结果,作为输出,推荐哪些讲座科目比较合适。
STEPUP!
从学习的意义来说,实际上不止于此。计算机推荐的科目,在推荐之后,最终是否真的销售出去了;或者说,购买者是否选择了别的科目,这些结果可以作为数据进行积累。这样,讲座课程是如何销售出去的,相关数据就能进一步累积起来。
通过这样去做,累积起来的数据就能用于下一次学习,形成良性循环。
因此,哪怕最初的数据非常粗略,重要的是尝试迈出第一步。虽然数据量较少,结果输出的数据精确度也不高,但是一旦开始尝试了,数据就会进一步积累,产生更高的价值,形成良性循环。所以,大家要重视速度,尽快着手去做。
过往是由人来思考程序算法。只要准备数据,计算机就能推导出程序算法,这是以前从未有过的方法。
而且,这是一个信息量越大,精确度越高的划时代的方法。今后,是否能够充分运用这种方法,就决定了能取得怎样截然不同的结果。
大家要切实理解机器学习是怎样的一种方法,以及输出、输入的数据化的关键作用。
小结
√机器学习是由计算机来拟定程序算法,是从前没有过的方法
√程序算法是基于大量的输入及输出数据,由计算机所拟定
√人的职责是,准备输出和输入的定义以及数据
√输出的定义和量化的方法最为重要
√积存的数据会产生更高的价值,所以迈出第一步非常重要