数据来源多样性,记录业务数据的不确定性,将会带来数据重复、缺失甚至错误的问题。为了更好地训练模型,数据清洗是必要的环节。
Ubuntu16安装MySQL
前言,因为使用hive需要使用mysql存储元数据,所以我需要在虚拟机ubuntu上安装mysql。之前用压缩包安装过,没有记录,本次形成文档,记录下来。在查询过程中,发现网上有更简单的方法,参考记录如下。
前言,因为使用hive需要使用mysql存储元数据,所以我需要在虚拟机ubuntu上安装mysql。之前用压缩包安装过,没有记录,本次形成文档,记录下来。在查询过程中,发现网上有更简单的方法,参考记录如下。