首页
关于
phaseless
导航
首页
关于
目录
标签
Pyspark
pyspark-sparksql练习
2022-04-09 23:36
25
0
0
26.5℃
Python
机器学习
Pyspark
1.实验数据说明: Student字段说明: 字段名 类型 备注 sno int 学号 sclass int 班级号 sname Date 姓名 sgender int 性别 sage int 年龄 Teacher字段说明: 字段名 类型 <
pyspark-通过协同过滤算法推荐电影
2022-04-09 23:35
24
0
0
26.4℃
机器学习
Python
Pyspark
数据集是Movielens官网的ml-100k数据,下载地址 https://grouplens.org/datasets/movielens/ 用jupyter实现比较好 from pyspark.sql import SparkSession user_df=spark.read.text('
pyspark-通过kmeans分析出租车数据并调用百度API进行可视化
2022-04-09 23:34
21
0
0
26.1℃
Pyspark
机器学习
Python
(1)数据准备 采用数据为出租车载客时的GPS记录数据集,数据格式为CSV,CSV格式是数据分析中常见的一种数据格式。CSV(Comma-Separated Values) 即逗号分隔值,文件以文本的方式存储表格数据(包含数字和文本)。其中每一行代表一条记录,每条记录被逗号分隔为字段,并且每条记录都
pyspark-机器学习实战:预测婴儿出生率(一)使用MLlib库
2022-04-08 22:50
14
0
0
25.4℃
Pyspark
机器学习
Python
机器学习是通过算法对训练数据构建出模型并对模型进行评估,评估的性能如果达到要求就拿这个模型来测试其他的数据,如果达不到要求就要调整算法来重新建立模型,再次进行评估,如此循环往复,最终获得满意的经验来处理其他的数据的过程。 简单点讲,机器学习就是通过一定的模型,让计算机可以从大量的数据中学习到相关的知
PySpark-机器学习实战:建立鸢尾属植物种的ML分类模型、建立ML回归模型并使用定义的特征预测电厂的发电量(使用ML库)
2022-04-08 22:48
24
0
0
26.4℃
机器学习
Pyspark
Python
分类和回归ML库在Spark的帮助下,从UCI机器学习知识库开源数据集。 iris数据集(https://archive.ics.uci.edu/ml/machine-learning-databases/iris) 电厂数据(https://archive.ics.uci.edu/ml/machi
弹