技术文档分享-数据科学小站技术文档分享

数据小站
数据科学成长之路
python

模型评估

回归模型、分类二分类模型下的评估方式1. 回归问题的模型评估 : 均方误差(MSE) 均方根误差(RMSE) 平均绝对误差(MAE) 决定系数(R^2 Score)mean_squared_error 均方误差MSE 均方误差是预测值与真实...

python

folium 地图

瓦片图层folium汇总地图的三个步骤: folium.map()生成一个地图地图, folium.Marker().add_to() 在地图中添加标记 , 保存地图文件以html格式可以打开添加对象的两种方式: 下级类.add_to(上级...

python

numpy内置函数

import numpy as np 文中“np” 约定俗成的代表了numpy缩写 1 np.empty_like() 复制一个与目标数组相同shape和类型的空数组 类似empty_like 的有 one_like, zeros_like...

python

pyecharts关系图grap接口使用

pyecharts的Graph类提供了绘制关系图的接口。绘制grap关系图时,需要准备好相应的数据格式。 import json from pyecharts import options as opts from pyecharts.ch...

python

mysql 日期时间函数应用

mysql查询本周的周一(星期一)和周日(星期日) 美国习惯的周一周日: 周一 : select subdate(curdate(),date_format(curdate(),’%w’)-1) 周日 : selec...

python

fuzzywuzzy简易的字符匹配工具

fuzzywuzzy提供了简单的字符串匹配接口。通过编辑距离,来匹配字符串直接的相似度。 fuzzywuzzy优点就是简单易用,轻量级。对两个字符串, 通过计算编辑最小的修改次数,来比较两个字符串之间的相似度。可以用在拼写纠正上。对于中文文...

python

python数据可视化-pyecharts插件使用文档

pyecharts是百度开源的可视化插件,可以将设计的可视化图表以html格式保存,配合jupyter可以一键生成动态的html数据分析报告。 pyecharts和matplotlib的区别在于,pyecharts有更加强大交互的可视化和嵌...

大数据

hadoop 用户命令

hadoop用户命令有archive、distcp、fs、fsck、jar、job、pipes、version、CLASSNAME hadoop version 查看当前hadoop的版本信息 distcp 递归拷贝文件信息 hadoop ...