书籍介绍
本书讲述R语言与Hadoop技术结合应用的权威书籍,由资深大数据分析师撰写,不仅系统且深入地阐释了R与Hadoop集成技术的工具、方法、原则和最佳实践,而且对各种常见问题进行深入分析,包含大量实践案例,可操作性强,能为用户高效利用R语言与Hadoop技术提供有效指导。全书共7章,分为四部分:第一部分(基础概念),包括第1~2章,主要讲解R语言以及Hadoop的安装过程、计算原理和基础概念;第二部分(初级应用),包括第3~4章,主要讲解RHIPE、RHadoop以及streaming三种实现方案;第三部分(高级实例),包括第5~6章,主要以RHadoop为技术背景,讲解多个实际应用案例;第四部分(数据库连接),包括第7章,主要讲解在RHadoop下如何同各类数据库进行连接。