上QQ阅读APP看书,第一时间看更新
2.1.1 监督比萨
还记得我在1.2节中说过的话吗?我们可以使用监督学习算法来训练一堆带有标签的样本数据,由此解决Roberto的比萨销量预测问题。为了获得这些样本数据,我们让Roberto记录下很多天的座位预订数和比萨销量,并将这些数据收集到一个文件之中。下面是这个数据文件的前几行:
这个文件中共有30行数据。每一行都是一个样本,由一个输入变量(座位预订数)和一个数值标签(比萨销量)组成。一旦我们有了一个算法,就可以使用这些样本数据进行训练。在后续的预测阶段,我们就可以将特定的座位预订数量输入给算法,并要求该算法输出与该数量相匹配的比萨销量。
让我们像数据科学家一样从数据入手。