i社区用户: 密码:
搜索:
首页| 资讯| 信息化| 视频| 专题| 创业| 企业中心| 企业博客| 职场| 周报全文| 方案中心 |电子杂志
市场会展| Blog| i社区| 社区联盟| RSS| 直播 | 发行| wiki |i| 下载| 英才招聘|CIO文库
IT两会 | 互联网年会
产品中心| 笔记本|台式机| DIY|数码| 服务器|网络通信| 手机|软件|显示器|信息安全|存储|组网| 动漫
首页|文库|数据中心|方案中心|专家库|厂商黄页|供求招标| 责编电话:010-68130909-1053
 
揭开DOE(试验设计)的神秘面纱之三--多因子DOE的魅力
 
 
 
 
2007-10-25 16:07:30
 
   
  通过前面的介绍,我们已经初步认识到了DOE的强大分析功能。但是有的读者可能会不以为然:在此之前的两个案例中因子的数量太少(只有3个),而实际需要解决的问题会复杂得多,涉及的因子数量也可能会很多(至少有
6个)。因此,他就可能会得出一个结论:DOE只适合于少数因子的问题分析,至于处理多因子问题,则显得无能为力了。

这个结论显然有失偏颇,其实DOE的一大特点就是可以处理包含多达50个(并不限于50个)因子的复杂问题,本期的主要内容就是向读者介绍多因子DOE的方法。

从理论上讲,上一期的DOE案例实质上采用的是完全因子设计(Full Factorial Design),这类方法在因子数量较少的时候实施起来比较方便。但是正如表一所示,当试验中的因子数量逐步增加时,试验次数却呈指数增加,庞大的试验规模意味着巨额的试验费用,意味着实施DOE的可行性越来越小。

因子数量

试验次数

2

4

3

8

4

16

5

32

6

64

7

128

8

256

9

512

10

1024

表一  完全因子DOE的局限

为了解决这个矛盾,我们可以用一种更具魅力的方法——部分因子设计(Fractional Factorial Design)来替代一般的完全因子设计。顾名思义,部分因子设计源于完全因子设计,是与其对应的完全因子设计中的一部分。但究竟是哪一部分,是否可以随机选取?举一个简单的例子来说明。

表二显示的是一个完全因子设计的计划表,A、B和C表示三个主因子,+1和-1表示因子的两个不同水平,AB、AC和BC表示二阶交互作用,ABC表示三阶交互作用,总共需要做8次不同的水平组合来完成1次完全因子设计的计划。

Run

A

B

C

AB

AC

BC

ABC

1

-1

-1

-1

1

1

1

-1

2

1

-1

-1

-1

-1

1

1

3

-1

1

-1

-1

1

-1

1

4

1

1

-1

1

-1

-1

-1

5

-1

-1

1

1

-1

-1

1

6

1

-1

1

-1

1

-1

-1

7

-1

1

1

-1

-1

1

-1

8

1

1

1

1

1

1

1

表二3因子的完全因子设计计划表

以上这个试验计划适用于3个或以下因子,可支持8次试验运行的DOE。如果增加了第四个因子D,但依然只能支持8次试验运行时,我们应该怎么办呢?原来表二中的计划表有 8行7列,任意两列间是相互正交的。我们希望增加一列来安排因子D,而且希望此列仍然能与前面各列保持正交性。数学上可以证明,“找出一个与前 7 列不同的列而与前3 列保持正交”是不可能的。换句话说,D 列必须与第4、5、6、7列中的某列完全相同。
 
完全相同意味着这两列的效应会被“混杂”(Confounded),即获得计算所得的分析结果后,分不清两种效应各是多少。权衡之下,我们认为取D=ABC 是最好的安排,因为通常主因子作用与三阶交互作用混杂的可能性最小。根据上述决定,将D列取值设定与ABC列相同,并将其前移至第 4 列,可以得到表三所列的计划表。

Run

A

B

C

D

AB

AC

BC

ABC(=D)

1

-1

-1

-1

-1

1

1

1

-1

2

1

-1

-1

1

-1

-1

1

1

3

-1

1

-1

1

-1

1

-1

1

4

1

1

-1

-1

1

-1

-1

-1

5

-1

-1

1

1

1

-1

-1

1

6

1

-1

1

-1

-1

1

-1

-1

7

-1

1

1

-1

-1

-1

1

-1

8

1

1

1

1

1

1

1

1

表三4因子的部分因子设计计划表
 
聪明的读者一定会猜到还可以使用图二的计划表继续构建出第5、第6乃至第7个因子,但试验的规模依然保留在8次。当然,当同等规模的试验中所涉及的因子数量越多时,产生“混杂”的概率会越大,后期分析结果的精确程度也会有所降低。这就是试验成本与分析精度这对矛盾的平衡,也是“部分因子设计”产生的基本原理。值得一提的是,在制定部分因子设计的具体方案时,不必如此繁琐地逐一推算,成熟的六西格玛统计分析软件JMP早已能够自动地实现了这一功能。
 
下面我们想通过一个发生在国外的DOE案例来体会部分因子设计的实际意义。

场景 : ACB公司是一家网络公司,主要为个人用户提供服务。近阶段以来公司网站的点击数总体偏低,排名在同行业中持续下滑,高层管理层决定通过一个DOE项目找到少数几个关键因素,提高公司网站的每周访问量。经过初步分析,项目团队发现关键词的个数、关键词的类型、URL标题、每周的更新频率、关键词在标题中的位置和免费礼物是最具可能性的关键因子。但是如果按传统的完全因子设计的思路,至少要做26=64次试验,项目的时间跨度超过一年,分析结果的价值性大大降低,有什么好办法来克服这个困难呢?

显然,这个案例用部分因子设计的DOE来实现是再合适不过了。针对已知的6个关键因子,各取两个最具代表性的水平值,鉴于该项目的主要目的是寻找关键因子,选择筛选效率最高的设计方案26-3(=8),不同水平组合时分别运行1周,八周后统计相应的点击数量,结果如表四所示。

URL标题

关键词的个数

关键词的类型

每周的更新频率

关键词在标题中的位置

免费礼物

点击数

5

4

第70个字符

5083

5

1

第40个字符

2272

10

1

第70个字符

2012

10

4

第40个字符

4328

5

4

第40个字符

6359

5

1

第70个字符

3676

10

1

第40个字符

4779

10

4

第70个字符

6549

表四DOE实施记录

接着,专业六西格玛统计分析软件JMP可以帮助我们做出具体的定性和定量的分析,不仅如此,它还等借助丰富生动的图形甚至动画将分析结果展现给我们。在此笔者不想强调过多的统计概念,只想用形象直观的图形说明分析结果。

无论是从图一的Pareto图,还是从图二的正态性图,我们都能清晰地发现每周的更新频率和关键词的类型是影响点击数的关键因子。由此可见,在部分因子设计的思想指引下,多因子试验的时间成本、经济成本大大减少,而主要的分析目的没有受到丝毫的影响,多因子DOE的魅力正吸引着更多的工作人员将DOE的分析方法应用到更多的应用领域中。

 
   
  (网页编辑:秋月  
     
  搜索相关内容 DOE    
   
   
      如果您对“揭开DOE(试验设计)的神秘面纱之三--多因子DOE的魅力”有任何疑问要咨询,或者您对我们专家的解答有任何疑义,请您点击以下的链接提交意向单,我们的编辑和信息化专家将会很快为您做出回答,您提供的信息经过审核后将有机会出现在我们的网页上。
专家介绍
惠普ProCurve构筑安全网络
检索
 
 
 
检索词 >>
电信 金融 信息安全
软件 CRM 电子政务
ERP 物流 电子商务
行业 >>
电信 能源 医疗
农业 银行 政府
交通 制造业 教育

收藏此页到ViVi
  发表评论  您的姓名   您的Email   发布  
   
相关文章
  • 揭开DOE(试验设计)的神秘面纱之二--初识DOE
  • 揭开DOE(试验设计)的神秘面纱之一--DOE就在你身边
  • 关于我们 | 客服热线 | 广告服务 | 招聘信息 | 法律声明 | 投稿指南 | 联系方式 
    Copyright(C) ccw.com.cn,All rights reserved
    中国计算机世界出版服务公司内容版权所有
    京ICP证010182