数据小站
数据科学成长之路

python

模型评估

回归模型、分类二分类模型下的评估方式1. 回归问题的模型评估 : 均方误差(MSE) 均方根误差(RMSE) 平均绝对误差(MAE) 决定系数(R^2 Score)mean_squared_error 均方误差MSE 均方误差是预测值与真实...

folium 地图

瓦片图层folium汇总地图的三个步骤: folium.map()生成一个地图地图, folium.Marker().add_to() 在地图中添加标记 , 保存地图文件以html格式可以打开添加对象的两种方式: 下级类.add_to(上级...

numpy内置函数

import numpy as np 文中“np” 约定俗成的代表了numpy缩写 1 np.empty_like() 复制一个与目标数组相同shape和类型的空数组 类似empty_like 的有 one_like, zeros_like...

pyecharts关系图grap接口使用

pyecharts的Graph类提供了绘制关系图的接口。绘制grap关系图时,需要准备好相应的数据格式。 import json from pyecharts import options as opts from pyecharts.ch...

mysql 日期时间函数应用

mysql查询本周的周一(星期一)和周日(星期日) 美国习惯的周一周日: 周一 : select subdate(curdate(),date_format(curdate(),’%w’)-1) 周日 : selec...

fuzzywuzzy简易的字符匹配工具

fuzzywuzzy提供了简单的字符串匹配接口。通过编辑距离,来匹配字符串直接的相似度。 fuzzywuzzy优点就是简单易用,轻量级。对两个字符串, 通过计算编辑最小的修改次数,来比较两个字符串之间的相似度。可以用在拼写纠正上。对于中文文...

python数据可视化-pyecharts插件使用文档

pyecharts是百度开源的可视化插件,可以将设计的可视化图表以html格式保存,配合jupyter可以一键生成动态的html数据分析报告。 pyecharts和matplotlib的区别在于,pyecharts有更加强大交互的可视化和嵌...

在Rstudio中使用python的一些问题

Rstudio中如果需要插入python代码,需要通过一个reticulate包来实现,需要先安装。 install.packages(“reticulate”) library(reticulate) repl_p...

pandas时间序列

pandas处理时间序列对象,主要是操作 DatetimeIndex和PeriodIndex 对象。 pandas时间戳序列 :DatetimeIndex对象 pandas时期对象 :PeriodIndex对象 DatetimeIndex

python3读取pdf内容

pdf文档解析库pdfminer.six 在python3环境下要对pdf文档进行解析,需要使用pdfminer.six库,通过pip install pdfminer.six进行安装。 在目前,存在pdfminer和pdfminer.si...