Category: 大数据

关于tomcat源代码的分析 0

关于tomcat源代码的分析

静态方法和类方法在分别在JVM的那个区域 在调用init()方法时,使用类加载器而不是用new Catalina () 调用Catalina的load方法 接口org.apache.catalina.Server. 实现类StandardServer.init() 调用Catalina的start方法 StandardServer.start()

电商数据导入与清洗实验报告 1

电商数据导入与清洗实验报告

一、实验背景 在电商数据分析流程中,数据导入是将原始数据引入分析环境的关键步骤,而数据清洗则是提升数据质量,确保后续分析结果准确性和可靠性的必要环节。本次实验基于前期收集的电商数据集,完成从本地存储的数据导入并进行全面清洗。 二、实验目的 熟练掌握将本地电商数据导入至数据分析环境(如 Hadoop + Hive)的方法与流程。 运用多种数据清洗技术,解决数据中存在的缺失值、重复值、异常值等问题,提高数据质量。 通过实验,积累数据处理经验,为深入的电商数据分析奠定良好基础。 三、实验环境 Hive 配置: 下载 Hive 安装包:由于 Ubuntu 官方软件源中可能没有 Hive 3.1.2 的现成安装包,需要从 Apache Hive 官网手动下载。在终端中执行以下命令下载 Hive 3.1.2 安装包: wget wget https://mirrors.huaweicloud.com/apache/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz 解压安装包:下载完成后,将安装包解压到合适的目录,例如/usr/local。 sudo tar -zxvf apache-hive-3.1.2-bin.tar.gz...

赣ICP备2025059670号