
Edward Capriolo:Media6degrees公司系统管理员,他是Apache软件基金会成员,还是Hadoop-Hive项目成员。 Dean Wampler:Think Big Analytics公司总顾问,对大数据问题以及Hadoop和机器学习有专门的研究。 Jason Rutherglen:Think Big Analytics公司软件架构师,对大数据、Hadoop、搜索和安全有专门的研究。
市场中第一本Hive图书。Hive在Hadoop系统中的应用趋势比较可观。
第1章基础知识1.1Hadoop和MapReduce综述1.2Hadoop生态系统中的Hive1.2.1Pig1.2.2HBase1.2.3Cascading、Crunch及其他1.3Java和Hive:词频统计算法1.4后续事情第2章基础操作2.1安装预先配置好的虚拟机2.2安装详细步骤2.2.1装Java2.2.2安装Hadoop2.2.3本地模式、伪分布式模式和分布式模式2.2.4测试Hadoop2.2.5安装Hive2.3Hive内部是什么2.4启动Hive2.5配置Hadoop环境2.5.1本地模式配置2.5.2分布式模式和伪分布式模式配置2.5.3使用JDBC连接元数据2.6Hive命令2.7命令行界面2.7.1CLI选项2.7.2变量和属性2.7.3Hive中“一次使用”命令2.7.4从文件中执行Hive查询2.7.5hiverc文件2.7.6使用HiveCLI的更多介绍2.7.7查看操作命令历史2.7.8执行shell命令2.7.9在Hive内使用Hadoop的dfs命令2.7.10Hive脚本中如何进行注释2.7.11显示字段名称第3章数据类型和文件格式3.1基本数据类型3.2集合数据类型3.3文本文件数据编码3.4读时模式第4章HiveQL:数据定义4.1Hive中的数据库4.2修改数据库4.3创建表4.3.1管理表4.3.2外部表4.4分区表、管理表4.4.1外部分区表4.4.2自定义表的存储格式4.5删除表4.6修改表4.6.1表重命名4.6.2增加、修改和删除表分区4.6.3修改列信息4.6.4增加列4.6.5删除或者替换列4.6.6修改表属性4.6.7修改存储属性4.6.8众多的修改表语句第5章HiveQL:数据操作5.1向管理表中装载数据5.2通过查询语句向表中插入数据5.3单个查询语句中创建表并加载数据5.4导出数据第6章HiveQL:查询6.1SELECT…FROM语句6.1.1使用正则表达式来指定列6.1.2使用列值进行计算6.1.3算术运算符6.1.4使用函数6.1.5LIMIT语句6.1.6列别名6.1.7嵌套SELECT语句6.1.8CASE…WHEN…THEN句式6.1.9什么情况下Hive可以避免进行MapReduce6.2WHERE语句6.2.1谓词操作符6.2.2关于浮点数比较6.2.3LIKE和RLIKE6.3GROUPBY语句6.4JOIN语句6.4.1INNERJOIN6.4.2JOIN优化6.4.3LEFTOUTERJOIN6.4.4OUTERJOIN6.4.5RIGHTOUTERJOIN6.4.6FULLOUTERJOIN6.4.7LEFTSEMI—JOIN6.4.8笛卡尔积JOIN6.4.9map—sideJOIN6.5ORDERBY和SORTBY6.6含有SORTBY的DISTRIBUTEBY6.7CLUSTERBY6.8类型转换6.9抽样查询6.9.1数据块抽样6.9.2分桶表的输入裁剪6.10UNIONALL第7章HiveQL:视图7.1使用视图来降低查询复杂度7.2使用视图来限制基于条件过滤的数据7.3动态分区中的视图和map类型7.4视图零零碎碎相关的事情第8章HiveQL:索引8.1创建索引8.2重建索引8.3显示索引8.4删除索引8.5实现一个定制化的索引处理器第9章模式设计9.1按天划分的表9.2关于分区9.3唯一键和标准化9.4同一份数据多种处理9.5对于每个表的分区9.6分桶表数据存储9.7为表增加列9.8使用列存储表9.8.1重复数据9.8.2多列9.9(几乎)总是使用压缩第10章调优10.1使用EXPLAIN10.2EXPLAINEXTENDED10.3限制调整10.4JOIN优化10.5本地模式10.6并行执行10.7严格模式10.8调整mapper和reducer个数10.9JVM重用10.10索引10.11动态分区调整10.12推测执行10.13单个MapReduce中多个GROUPBY10.14虚拟列第11章其他文件格式和压缩方法11.1确定安装编解码器11.2选择一种压缩编/解码器11.3开启中间压缩11.4最终输出结果压缩11.5sequencefile存储格式11.6使用压缩实践11.7存档分区11.8压缩:包扎……第12章开发第13章函数第14章Streaming第15章自定义Hive文件和记录格式第16章Hive的Thrift服务第17章存储处理程序和NoSQL第18章安全第19章锁第20章Hive和Oozie整合第21章Hive和亚马逊网络服务系统(AWS)第22章HCatalog第23章案例研究术语词汇表
评论关闭。