技术文档分享-数据科学小站技术文档分享

数据小站
数据科学成长之路
hive

hive中嵌入python代码

hive > add file ./…….py.paht; hive > select transform(col_name1 ,col_name2)using‘python json.py ...

hive

hive官方文档摘录

DDL Operations 1. 建表操作 hive> CREATE TABLE pokes (foo INT, bar STRING); hive> CREATE TABLE invites (foo INT, bar ST...

机器学习

百度NLP分词工具-LAC

百度开源的中文分词、词性标注、专名识别的中文自然语言处理工具,提供python java c 调用借口。 安装 pip install lac LAC使用 对中文语言处理,主要通过调用LAC 类实现 class LAC(object): "...

应用系列

数据分析实战-基于用户的行为特征,预测用户的留存

项目背景 面向C的app应用,用户的行为分析是亘古不变的话题。其中有一个方向是根据用户在app上的行为特征,来预用户的留存。 不同公司之间的产品,用户的行为或许有差别。本次实验案例采用部分用户数据,在T当天的登陆、查看、主动聊天、被动聊天,...

hive

hive中对数据表的管理-创建、复制、加载数据

hive中分区表创建:hive中 PARTITIONED BY 创建表分区 hive中创建表时,可以通过PARTITIONED BY来创建分区,语法: 分区表的分区字段,是虚拟字段,不是数据本身。实际上是数据存储的路径目录名称。 creat...

hive

hive中的with使用

hive中的with,提供了一个子查询的功能,通过with …as,将一部分查询数据存储在内存中,提供给下一次的查询使用。 with v1 as ( …sql 语句) select * from v1 ; with ...

sklearn

sklearn中特征工程feature_extraction的使用方法

sklearn的特征工程在 feature_extraction模块中,提供了一系列将文本内容转换成词向量的方法。有字典特征提取DictVectorizer、散列特征提取FeatureHasher、文本特征提取、图片特征提取多种方式。 字典...

sklearn

sklearn中的线性回归api使用

导入线性回归中用到的模块 sklean中的线性回归模型,在liner_model模块中,常用有线性回归、SGD回归,和岭回归等不同的分类器:LinearRegression,SGDRegressor,Ridge。不同分类器在计算时采用的方式...

linux

linux下wordpress配置的一些问题

WordPress未能连接到FTP服务器 xxxxxxx:21 在后台更新和按照插件时,输入密码后会提示连接ftp服务器失败, 解决办法: 打开 wp-config.php文件 , 在最后面加上  不需要输入密码直接下载...