关注微信

推荐商品

    加载中... 正在为您读取数据...
分享到:
  • 驾驭大数据[平装]
  • 共4个商家     33.90元~40.00
  • 作者:(美)BillFranks(作者),黄海(译者),车皓阳(译者),王悦(译者)
  • 出版社:人民邮电出版社;第1版(2013年1月13日)
  • 出版时间:
  • 版次 :
  • 印刷时间:
  • 包装:
  • ISBN:9787115304803

  • 商家报价
  • 简介
  • 评价
  • 加载中... 正在为您读取数据...
  • 商品描述

    编辑推荐

    《驾驭大数据》是世界顶级数据仓库公司Teradata首席分析专家Bill Franks倾力巨献,揭秘驾驭大数据的技术和方法,诠释大数据专业分析之道。国内外知名数据分析专家、行业领袖联袂推荐。
    你是否在大数据面前犹豫、恐惧、不知所措?你是否无法说服你的老板投入人力、财力、物力去进行大数据分析?你是否已经身处大数据中而依旧茫然?你是否在做了很多大数据分析后仍然无法发现新的商业价值和机会?如何不再因循守旧,如何积极主动地去改变、探索、创新,如何在驾驭大数据的过程中游刃有余、成竹在胸?答案就在《驾驭大数据》一书中!

    名人推荐

    “随着信息技术的飞速发展,人类社会已进入一个数字信息时代。即时获取和掌握信息的多少,己成为衡量一个国家实力强弱的标志。但一切信息,又随不同需求者而定义为有益与否,而一切有益信息都是从海量数据中经过分析而生成的。海量数据又随时间不断产生,不断流动、扩散,形成一股像海潮的大数据流。只有经过对大数据的分析才能形成各自需要的信息,才能从信息中产生知识,才能造就智慧型社会。本书作者就大数据兴起及分析方法和技巧作出了深入浅出的表述,在当前大数据热潮中,值得一读。”
    ——吴基传 原国家信息产业部部长
    “信息技术的飞速发展,以及互联网企业商业模式的不断创新,使得全球数据量呈现出几何级数般的爆炸性增长,全球进入了大数据时代。红楼梦中‘任凭弱水三千,我只取一瓢饮’,在浩瀚的信息海洋中,谁能够更快速、更准确地获取有价值的信息并充分利用,谁就能在大数据时代立于不败之地,获得成功。如何充分利用大数据、挖掘大数据所蕴含的价值,需要我们把握大数据的特点,积极探索海量数据存储、实时数据处理、新型分析挖掘技术的应用,以及新的数据架构的设计等解决之道。本书对上述问题进行了深入探讨,提出了许多真知灼见,值得一读。”
    ——王晓初 中国电信集团公司董事长
    “大数据时代不以人的意志而来。对此,不仅要认知和熟悉,更要学会驾驭与运用。与一般大数据书籍不同,本书聚焦如何在分析中凝炼数据价值、在运用中创造数据财富,发乎启迪,止乎‘驾驭’,对于人们在大数据的浪潮中畅享更多精彩大有裨益。”
    ——常小兵 中国联通集团公司董事长
    “现代信息技术推动了大数据的发展,大数据给各行各业带来了许多新的机会。面对大数据的浪潮,人们关心如何去釆集和汇总海量的数据,人们更关心如何对采集到的数据进行系统性的分析,通过分析体现出数据的价值,并在实际工作中得到充分的利用。本书很好地回答了这些问题。”
    ——王建宙 原中国移动集团公司董事长
    “大数据浪潮催生了一个新的产业,也催生了一本又一本关于大数据的新书。这一本由业内的技术先驱和行业领导者之一Teradata的专家 Bill Franks 撰写的著作,从丰富的实战经验中萃取出大数据相关的若干关键的概念,并给予了精确而易懂的解读。它可以让大数据的客户、方案提供者、分析师们在短时间内通盘了解关于大数据的概念、主要技术、工具、方法和流程,快速走上决胜未来的大数据之路。”
    ——刘博 明博智创(北京)软件技术有限责任公司董事长
    “面对大数据带来的挑战和机遇,卓越的科技和商业领袖都认识到大数据分析技术和实践的优势。完成这种炼数成金的思想转变,领悟到洞察力的真正价值,将获得驱动业务发展的无穷能量。本书不仅涵盖驾驭大数据的最佳技术、方法和流程,而且介绍了如何培养优秀的分析师及创新文化,专注于大数据链条中最核心的分析和决策行动环节,是大数据时代每一位思想家、技术精英和商业领袖必读的书籍。”
    ——吴辅世 SAS赛仕软件大中华区总裁

    媒体推荐

    “随着信息技术的飞速发展,人类社会已进入一个数字信息时代。即时获取和掌握信息的多少,己成为衡量一个国家实力强弱的标志。但一切信息,又随不同需求者而定义为有益与否,而一切有益信息都是从海量数据中经过分析而生成的。海量数据又随时间不断产生,不断流动、扩散,形成一股像海潮的大数据流。只有经过对大数据的分析才能形成各自需要的信息,才能从信息中产生知识,才能造就智慧型社会。本书作者就大数据兴起及分析方法和技巧作出了深入浅出的表述,在当前大数据热潮中,值得一读。”
    ——吴基传 原国家信息产业部部长

    “信息技术的飞速发展,以及互联网企业商业模式的不断创新,使得全球数据量呈现出几何级数般的爆炸性增长,全球进入了大数据时代。红楼梦中‘任凭弱水三千,我只取一瓢饮’,在浩瀚的信息海洋中,谁能够更快速、更准确地获取有价值的信息并充分利用,谁就能在大数据时代立于不败之地,获得成功。如何充分利用大数据、挖掘大数据所蕴含的价值,需要我们把握大数据的特点,积极探索海量数据存储、实时数据处理、新型分析挖掘技术的应用,以及新的数据架构的设计等解决之道。本书对上述问题进行了深入探讨,提出了许多真知灼见,值得一读。”
    ——王晓初 中国电信集团公司董事长

    “大数据时代不以人的意志而来。对此,不仅要认知和熟悉,更要学会驾驭与运用。与一般大数据书籍不同,本书聚焦如何在分析中凝炼数据价值、在运用中创造数据财富,发乎启迪,止乎‘驾驭’,对于人们在大数据的浪潮中畅享更多精彩大有裨益。”
    ——常小兵 中国联通集团公司董事长

    “现代信息技术推动了大数据的发展,大数据给各行各业带来了许多新的机会。面对大数据的浪潮,人们关心如何去釆集和汇总海量的数据,人们更关心如何对采集到的数据进行系统性的分析,通过分析体现出数据的价值,并在实际工作中得到充分的利用。本书很好地回答了这些问题。”
    ——王建宙 原中国移动集团公司董事长

    “大数据浪潮催生了一个新的产业,也催生了一本又一本关于大数据的新书。这一本由业内的技术先驱和行业领导者之一Teradata的专家 Bill Franks 撰写的著作,从丰富的实战经验中萃取出大数据相关的若干关键的概念,并给予了精确而易懂的解读。它可以让大数据的客户、方案提供者、分析师们在短时间内通盘了解关于大数据的概念、主要技术、工具、方法和流程,快速走上决胜未来的大数据之路。”
    ——刘博 明博智创(北京)软件技术

    作者简介

    作者:(美国)Bill Franks

    Bill Franks是Teradata公司全球合作伙伴计划的首席分析专家,他负责跟踪研究分析领域的前端趋势,帮助客户理解Teradata和其分析合作伙伴如何为客户创造价值。Bill还负责管理Teradata与SAS合作成立的业务分析创新中心,并专注于帮助客户获得创新分析能力。此外,Bill负责制定Teradata公司在高级分析领域的战略与定位。
    Bill是国际数据分析研究所的一名讲师,国际数据分析研究所(International Institute for Analytics)是由分析领域专家Tom Davenport成立的研究机构。Bill还是一名活跃的演讲人和博客作者,Bill一直专注于如何将复杂的分析转化为业务人员可以理解的语言,并帮助企业更有效地使用这些分析成果。他曾服务于很多不同行业和公司规模的客户,其中有财富前100强的大型企业,也有小型的非营利组织。
    Bill拥有弗吉尼亚科技大学应用统计专业的学士学位,以及北卡罗来纳州立大学应用统计专业的硕士学位。

    目录

    第一部分 大数据的兴起
    第1章 什么是大数据,大数据为什么重要
    1.1 什么是大数据
    1.2 大数据中的“大”和“数据”哪个更重要
    1.3 大数据有何不同
    1.4 大数据为何是数量更多的、相同类型的传统数据
    1.5 大数据的风险
    1.6 你为什么需要驾驭大数据
    1.7 大数据的结构
    1.8 探索大数据
    1.9 很多大数据其实并不重要
    1.10 有效过滤大数据
    1.11 将大数据和传统数据混合
    1.12 对大数据标准的需求
    1.13 今天的大数据将不再是明天的大数据
    1.14 本章小结
    第2章 网络数据:原始的大数据
    2.1 网络数据概观
    2.1.1 你遗漏了什么
    2.1.2 想象各种可能性
    2.1.3 一个全新的信息来源
    2.1.4 应当收集什么数据
    2.1.5 关于隐私
    2.2 网络数据揭示了什么
    2.2.1 购物行为
    2.2.2 顾客的购买路径和偏好
    2.2.3 研究行为
    2.2.4 反馈行为
    2.3 行动中的网络数据
    2.3.1 最优的推荐商品
    2.3.2 流失模型
    2.3.3 响应模型
    2.3.4 顾客分类
    2.3.5 评估广告效果
    2.4 本章小结
    第3章 典型大数据源及其价值
    3.1 汽车保险业:车载信息服务数据的价值
    3.2 多个行业:文本数据的价值
    3.3 多个行业:时间数据与位置数据的价值
    3.4 零售制造业:RFID数据的价值
    3.5 电力行业:智能电网数据的价值
    3.6 博彩业:筹码跟踪数据的价值
    3.7 工业发动机和设备:传感器数据的价值
    3.8 视频游戏:遥测数据的价值
    3.9 电信业与其他行业:社交网络数据的价值
    3.10 本章小结
    第二部分 驾驭大数据:技术、过程以及方法
    第4章 分析可扩展性的演进
    4.1 分析可扩展性的历史
    4.2 分析与数据环境的关联性
    4.3 海量并行处理系统
    4.3.1 使用MPP系统进行数据准备与评分
    4.3.2 使用MPP系统进行数据准备与评分小结
    4.4 云计算
    4.4.1 公有云
    4.4.2 私有云
    4.4.3 云计算小结
    4.5 网格计算
    4.6 MapReduce
    4.6.1 MapReduce工作原理
    4.6.2 MapReduce优缺点
    4.6.3 MapReduce小结
    4.7 这不是一个单选题
    4.8 本章小结
    第5章 分析流程的演进
    5.1 分析沙箱
    5.1.1 分析沙箱:定义与范围
    5.1.2 分析沙箱的好处
    5.1.3 内部分析沙箱
    5.1.4 外部分析沙箱
    5.1.5 混合式分析沙箱
    5.1.6 不要仅仅使用数据,而要丰富数据
    5.1.7 系统负载管理和容量规划
    5.2 什么是分析数据集
    5.2.1 两种分析数据集
    5.2.2 传统的分析数据集
    5.3 企业分析数据集
    5.3.1 什么时候创建企业分析数据集
    5.3.2 企业分析数据集里有什么
    5.3.3 逻辑结构与物理结构
    5.3.4 更新企业分析数据集
    5.3.5 汇总表还是概要视图
    5.3.6 分享财富
    5.4 嵌入式评分
    5.4.1 嵌入式评分集成
    5.4.2 模型与评分管理
    5.5 本章小结
    第6章 分析工具与方法的演进
    6.1 分析方法的演进
    6.1.1 组合建模
    6.1.2 简易模型
    6.1.3 文本分析
    6.1.4 跟上分析方法的发展脚步
    6.2 分析工具的演进
    6.2.1 图形化用户界面的崛起
    6.2.2 单点解决方案的兴起
    6.2.3 开源的历史
    6.2.4 数据可视化的历史
    6.3 本章小结
    第三部分 驾驭大数据:人和方法
    第7章 如何提供优质分析
    7.1 分析与报表
    7.1.1 报表
    7.1.2 分析
    7.2 分析的G.R.E.A.T原则
    7.2.1 导向性(Guided)
    7.2.2 相关性(Relevant)
    7.2.3 可解释性(Explainable)
    7.2.4 可行性(Actionable)
    7.2.5 及时性(Timely)
    7.3 核心分析方法与高级分析方法
    7.4 坚持你的分析
    7.5 正确地分析问题
    7.6 统计显著性与业务重要程度
    7.6.1 统计显著性
    7.6.2 业务重要程度
    7.7 样本VS全体
    7.8 业务推断与统计计算
    7.9 本章小结
    第8章 如何成为优秀的分析专家
    8.1 哪些人是分析专家
    8.2 对分析专家常见的误解
    8.3 每一位优秀的分析专家都是独特的
    8.3.1 教育
    8.3.2 行业经验
    8.3.3 当心“人力资源清单”
    8.4 优秀分析专家身上经常被低估的特质
    8.4.1 承诺
    8.4.2 创造力
    8.4.3 商业头脑
    8.4.4 演讲能力与沟通技巧
    8.4.5 直觉
    8.5 分析认证有意义吗,还是干扰视听的噪音
    8.6 本章小结
    第9章 如何打造优秀的分析团队
    9.1 各个行业并非生而平等
    9.2 行动起来
    9.3 人才紧缩
    9.4 团队组织结构
    9.4.1 分布式组织结构
    9.4.2 集中式组织结构
    9.4.3 混合式组织结构
    9.5 持续更新团队技能
    9.5.1 矩阵式方法
    9.5.2 管理人员不能眼高手低
    9.6 应该由谁来做高级分析工作
    9.6.1 前后矛盾的地方
    9.6.2 如何帮助刚刚从事分析工作的新手茁壮成长
    9.7 IT人员和分析专家为何相处不好
    9.8 本章小结
    第四部分 整合:分析文化
    第10章 促进分析创新
    10.1 商业需要更多创新
    10.2 传统的方法阻碍了创新
    10.3 定义分析创新
    10.4 在创新分析中使用迭代方法
    10.5 考虑换个角度
    10.6 你是否为建立分析创新中心做好了准备
    10.6.1 组件1:技术平台
    10.6.2 组件2:第三方的产品和服务
    10.6.3 组件3:承诺和支持
    10.6.4 组件4:强大的团队
    10.6.5 组件5:创新委员会
    10.6.6 分析创新中心的指导原则
    10.6.7 分析创新中心的工作范围
    10.6.8 处理失败
    10.7 本章小结
    第11章 营造创新和探索的文化氛围
    11.1 做好准备
    11.1.1 Crocs和Jibbitz的传说
    11.1.2 推动创新
    11.2 关键原则概述
    11.2.1 原则1:打破思维定势
    11.2.2 原则2:形成连锁反应
    11.2.3 原则3:统一行动目标
    11.3 本章小结
    结论:再敢想一些

    文摘

    版权页:



    插图:



    使用传感器数据
    发动机的结构很复杂,有很多移动部件,必须在高温下运转,会经历各种各样的运转状况。因为它们的成本太高,所以期望寿命越长越好。因此,稳定的、可预测的性能就变得异常重要,因为机器的寿命依赖于此。例如,对故障飞机进行保养维修会花掉航空公司或者空军部队一笔不小的钱,但这种事情我们还必须做,因为我们要识别出飞机是否存在安全隐患。因此,飞机或者飞机发动机以及其他设备的停机时间一定要降到最低,航空公司或者空军部队对此都有非常迫切的需求。
    停机时间最小化策略包括准备备件或后备发动机快速割接时需要维修的设备、从诊断结果中快速识别需要更换的部件、针对问题部件投资开发更可靠的新版本。要想有效实施这3种策略,必须得有数据。我们要用数据生成诊断算法,或者用数据作为输入来诊断某个特定的问题。工程部门可以使用传感器数据准确地定位问题的原因,设计新的措施支持更长、更可靠的操作。不管发动机是飞机的,还是船只的,或者是陆地设备的,这些考虑因素都适用。
    通过提取和分析详细的发动机运转数据,我们可以精确地定位那些会导致立即失效的某些模式。然后我们就能识别出会降低发动机寿命的时间分段模式以及更加频繁的维修。多个变量的排列组合数目,特别是一段时间内的排列组合数目,使得这类数据分析活动变成了一项挑战。这个过程不仅会涉及到大数据,就连随之开发出来的分析也会变得异常复杂和困难。以下是我们可以研究的一些问题。