Jancy
Jancy
热度 41 ℃
2019-09-10

Hive笔记

该文为个人学习笔记,仅供参考。 更多内容关注本人Halo^0博客 Hive介绍 概述 hive是基于Hadoop的一个数据仓库^1工具,由Facebook开源,用于解决海量结构化的数据统计项目。 Hive本质 Hive表及数据本质上是HDFS上的目录和文件。 将SQL(HQL^2)语句转化成M...
Jancy
Jancy
热度 25 ℃
2019-08-29

安装hive本地模式

安装前确认安装已安装mysql 下载安装包 此处提供cdh发行的hive-1.1.0-5.14.2版本,点击下载。 解压 $ tar -zxcf hive-1.1.0-cdh5.14.2.tar.gz -C /usr/local/hive/hive-1.1.0-cdh5.14.2/ $ m...
Jancy
Jancy
热度 72 ℃
2019-08-24

Oracle数据库知识点梳理

Oracle基本操作 SQL: ​ DDL:数据定义语言 ​ DML:数据操纵语言 ​ DCL:数据控制语言 ​ DQL:数据查询语言 创建表空间、用户及授权操作 创建表空间 create tablespace demo datafile '/home/oracle/demospace.dbf'...
Jancy
Jancy
热度 138 ℃
2019-08-24

Mysql数据库知识点梳理

知识点梳理 数据库、表创建删除 DDL 增、删、改 DML 查询 DQL 内联查询 左右外联查询 子查询 数据库权限管理 DCL 索引 事务 触发器 存储过程 数据库备份 DDL 数据库操作 数据库创建 create database [if not exists] db_name; ...
Jancy
Jancy
热度 40 ℃
2019-08-11

运维之服务器环境搭建

Mysql安装 centos安装 配置Mysq官方yum repository [root@localhost ~]# wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm 安装reposit...
Jancy
Jancy
热度 585 ℃
2019-04-18

python爬虫爬取糗事百科段子

技术点 python request模块 re模块 正则表达式 爬取糗事百科热图 import re import requests import os from urllib import request if not os.path.exists('pic'): os.mkdir(...
Jancy
Jancy
热度 614 ℃
2019-04-18

python爬虫入门之request模块爬虫

python爬虫入门之request模块爬虫 爬虫概念 爬虫呢,就是编写一个程序去模仿上网过程,让其去互联网上获取数据的过程。 爬虫分类 爬虫大致分为四种: 通用爬虫:爬取整个页面。 聚焦爬虫:只爬取页面中你需要的部分内容。 增量式爬虫:动态爬取页面,尽可能保证爬到的是新的页面。 深度爬虫:这我也...
Jancy
Jancy
热度 571 ℃
2019-04-09

hadoop遇到的坑(持续更新)

ssh远程命令脚本Commands.sh Commands.sh #!/bin/bash params=$@ $params i=1 for((i=1;i<=2;i=$i+1));do echo ======== slave$i $params=========== ssh...
Jancy
Jancy
热度 268 ℃
2018-12-17

Pandas实战——NBA篮球队员成绩分析【修订版】

在前一篇实战中,小编漏掉一个参数,以及没有按照实际情况考虑(同一个人多个赛季但还是这个人),导致结果有偏差。 话不多说,直接上代码! #@Time : 2018/12/10 13:13 #@Author : focuspoints.cn import pandas as pd from n...
Jancy
Jancy
热度 616 ℃
2018-12-15

Pandas实战——NBA篮球队员成绩分析

引用资料下载:NBA球员数据.csv 题目描述 编写python程序,输入数目n,输出n个最有效率的球员。计算效率需要将整个效率除以该球员的比赛场数。详细公式如下: Efficiency = ((pts + reb + asts + stl + blk) - ((fga - fgm) + (ft...