词条 | 数据挖掘基础与应用(SQL Server 2008) |
释义 | 基本信息作者: 谢邦昌 [作译者介绍]丛书名: 商务智能与信息化技术丛书 出版社:机械工业出版社 ISBN:9787111360735 上架时间:2011-11-8 出版日期:2012 年1月 开本:16开 页码:1 版次:1-1 内容简介《数据挖掘基础与应用(sql server 2008)》首先系统地介绍了数据挖掘技术,然后虚拟一个“邦邦超市”,通过使用sql语言建立该超市的数据库并对数据进行操作,再进一步利用sql server 2008的数据挖掘模型对超市积累的数据进行挖掘,以实际例子帮助读者迅速理解并掌握数据挖掘技术,学会使用sql server 2008 提供的数据挖掘工具,提高零售企业的信息利用能力和经营水平。 对于想要了解数据挖掘技术及其应用的读者,本书是很好的参考读物。 作者简介谢邦昌教授,台湾大学生物统计学博士、 现任台湾辅仁大学统计资讯学系教授、台湾辅仁大学管理学院商学所所长、中华资料采矿协会理事长、台北市政府市政顾问。他还担任中华人民共和国国家统计局教材编审委员,厦门大学经济学院计划统计系讲座教授、博士生导师,同时是中国人民大学统计学院、中央财经大学统计学院等国内许多著名高校的客座教授。 谢邦昌教授是台湾数据挖掘界的领军人物及世界知名统计学家,长久以来致力推动两岸商务智能、数据挖掘和统计应用研究的发展。目前的研究方向主要集中 目录《数据挖掘基础与应用(sql server 2008)》 前言 第1章 数据挖掘与数据仓库 1 1.1 数据挖掘简介 1 1.1.1 数据挖掘的定义 1 1.1.2 数据挖掘的重要性 1 1.1.3 数据挖掘的功能 1 1.1.4 数据挖掘的步骤 2 1.1.5 数据挖掘建模的标准crisp-dm 2 1.2 商务智能简介 4 1.2.1 商务智能 4 1.2.2 商务智能的定义 4 1.2.3 商务智能的架构 5 1.2.4 商务智能的实施流程 5 1.3 数据挖掘与其他相关领域的关系 6 1.3.1 数据挖掘与统计分析的不同 6 1.3.2 数据挖掘与数据仓库的关系 6 1.3.3 kdd与数据挖掘的关系 7 1.3.4 在线分析处理(olap)与数据挖掘的关系 7 1.3.5 数据挖掘与机器学习的关系 8 .1.3.6 web挖掘和数据挖掘有什么不同 8 1.4 数据挖掘在客户关系管理中的应用 9 1.4.1 客户关系管理(crm) 9 1.4.2 客户关系管理指标 10 1.4.3 数据挖掘应用于各行业 13 1.4.4 客户市场细分 14 1.4.5 交叉销售 15 1.4.6 客户关系管理四大循环过程 15 1.4.7 数据库营销 16 1.5 数据仓库定义 17 1.5.1 数据仓库特性 17 1.5.2 数据仓库架构 18 1.5.3 构建数据仓库的原因 19 1.5.4 构建数据仓库的主要目的 19 1.5.5 数据仓库的应用 20 1.5.6 数据仓库的管理 20 1.6 数据挖掘工具分类 21 1.6.1 数据挖掘工具 21 1.6.2 各工具的简介 21 第2章 sql语言介绍及其实例 22 2.1 sql简介及数据变量来源说明 22 2.1.1 何谓sql 22 2.1.2 各数据文档变量说明 23 2.2 sql基本语法介绍 25 2.3 会员基本资料整理 40 2.3.1 查询县市别填答状态 40 2.3.2 婚姻状态 42 2.4 会员基本变项 43 2.4.1 性别 43 2.4.2 交易周期性变化 49 2.4.3 会员在交易时的年龄及婚姻状态 52 2.4.4 会员交易金额及红利积点次数分配百分比 55 2.4.5 平均交易间隔时间 59 2.5 产品组合 62 2.5.1 按照产品编号排行榜 63 2.5.2 单项产品的排行榜 68 2.5.3 重复购买率 71 2.6 会员流失率 79 2.7 会员贡献度 83 第3章 sql server 2008的数据挖掘模型在零售业中的应用 86 3.1 实际案例练习 86 3.1.1 数据挖掘microsoft决策树 87 3.1.2 数据挖掘microsoft罗吉斯回归 90 3.1.3 数据挖掘microsoft类神经网络 93 3.1.4 数据挖掘microsoft贝氏概率分类 97 3.2 潜在客户预测模型 99 3.2.1 潜在客户预测流程图 99 3.2.2 交易频率趋势图 100 3.2.3 交易频率语法 101 3.3 模型建构 102 3.3.1 ssis操作流程 102 3.3.2 ssas操作流程 113 3.3.3 数据挖掘microsoft决策树模型建构 118 3.3.4 数据挖掘microsoft罗吉斯回归模型建构 128 3.3.5 数据挖掘microsoft类神经网络及贝氏概率模型建构 130 3.3.6 模型比较 132 3.4 数据挖掘microsoft时间序列 140 3.4.1 基本概念 140 3.4.2 时间序列的成分 142 3.4.3 时间序列数据的图形介绍 143 3.4.4 利用修匀法预测 147 3.4.5 用趋势投射预测时间序列 150 3.4.6 预测含趋势与季节成分的时间序列 151 3.4.7 利用回归模型预测时间序列 152 3.4.8 其他预测模型 153 3.4.9 模型单变量时间序列预测模型 153 3.4.10 时间趋势预测模型 155 3.4.11 范例操作 156 3.5 数据挖掘microsoft聚类分析 165 3.5.1 基本概念 165 3.5.2 范例操作 167 3.6 数据挖掘microsoft线性回归 182 3.6.1 基本概念 182 3.6.2 简单线性回归分析 184 3.6.3 多元回归分析 184 3.6.4 岭回归分析 184 3.6.5 范例操作 185 3.6.6 补充(测试集数据汇出) 205 3.7 数据挖掘microsoft关联规则 208 3.7.1 基本概念 208 3.7.2 关联规则的种类 209 3.7.3 关联规则的算法:apriori算法 209 3.7.4 关联规则dmx数据挖掘语法 210 3.8 数据挖掘microsoft时序群集 211 3.8.1 基本概念 211 3.8.2 相关研究 211 3.8.3 时序群集dmx数据挖掘语法 212 第4章 olap在零售业中的应用 214 4.1 数据仓库 214 4.2 实例操作 217 4.2.1 数据来源检查 217 4.2.2 创建命名查询(vip会员数据) 222 4.2.3 编辑命名查询(vip产品组成货号) 224 4.2.4 编辑命名查询(vip订单明细表) 225 4.2.5 编辑命名查询(vip订单数) 225 4.2.6 编辑命名查询(vip购买产品) 225 4.2.7 编辑命名查询(vip会员数) 226 4.3 维度设计 227 4.4 建立多维数据集 238 4.4.1 对企业的价值 238 4.4.2 数据储存的选择性 239 4.4.3 实例操作 240 4.5 数据模拟及相关数据明细 249 第5章 excel中的数据挖掘模块 253 5.1 安装与设定数据挖掘加载宏 253 5.1.1 系统需求 253 5.1.2 开始安装 253 5.1.3 完成安装检查 256 5.1.4 状态设定 256 5.1.5 设定完成检查 259 5.2 excel 2007数据挖掘工具列介绍 260 5.2.1 数据挖掘使用帮助 260 5.2.2 数据挖掘连接设定 261 5.2.3 设定目前的连接 261 5.2.4 跟踪 263 5.2.5 数据准备 263 5.2.6 浏览数据 263 5.2.7 清除数据 266 5.2.8 为数据分区 267 5.2.9 数据建模 270 5.2.10 准确性和验证 270 5.2.11 精确度图表 270 5.2.12 分类矩阵 271 5.2.13 利润图 272 5.2.14 模型使用方法 272 5.2.15 浏览 272 5.2.16 查询 275 5.2.17 模型管理 275 5.2.18 重命名此挖掘结构 276 5.2.19 删除此挖掘结构 276 5.2.20 清除此挖掘结构 276 5.2.21 使用原始数据处理此挖掘结构 277 5.2.22 用新数据处理此挖掘结构 277 5.2.23 导出此挖掘结构 278 5.2.24 导入 278 附录 279 前言随着时代的进步,大型超市已经成为生活中不可或缺的一部分,逛大型超市购物已经成为城市居民日常的生活习惯,食品、衣服和众多的百货在各大超市一应俱全。近年来,超市如雨后春笋般一间间地崛起,目前主要以沃尔玛、家乐福、华润和华联为主,彼此之间的竞争与合作、合纵连横不言而喻。 每逢特定节假日超市都会有相应的促销活动。例如年终时节,各超市都会推出迎春节减价拼人气促销活动:各式各样折扣的节庆礼包,同时通过在超市现场歌舞表演和各种抽奖活动吸引人潮进行宣传。各超市都强调绝对是当地最低价,有的超市推出数十款春节特色礼包,礼包价格较之单独购买商品便宜许多,可以使过年送礼的消费者节省开支。此外,为争取业绩及方便白天上班的客户购物,超市还在节日期间推迟打烊时间。超市会在开学前主推3C、文具等开学用品,因为这时台式机、笔记本电脑的需求量几乎是平时的3倍。超市纷纷祭出低价、赠品大放送策略,同时也搭配买千送百、分期0利率、红利积点等促销手段。 消费者购物的行为特点有超市化、周末化、全家化、休闲化、省钱化、冲动化、M型化与会员化的特点。对超市卖场来说,数据挖掘的新兴技术和商务智能的运用更是日趋重要。要从每天涌进数十万、甚至数百万的交易订单里,挖掘出有意义的商业信息,数据挖掘这一新兴科学在客户关系管理中扮演了关键的角色。不论是从关联规则看购物篮分析、从聚类分析看客户市场细分、从时间序列看未来销售量趋势,还是从决策树、罗吉斯回归、类神经网络等看潜在客户的预测,这些都是超市在市场营销中非常重要的科学技术。因此,本书将以Microsoft SQL Server 2008数据库系统,虚拟的邦邦超市为例,介绍SQL的基本语法,循序渐进地告诉读者如何从海量的数据中整理数据、创造有意义的新变量,将会员基本数据和订单数据合并成为待分析的数据样本以计算重复购买率、会员贡献度及会员流失率,以及利用SQL的数据挖掘技术解决实务的问题。盼读者慢慢品味,感受到作者的用心。 |
随便看 |
|
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。