分解聚类法(decomposition clustering method)
聚类分析的一种方法。其做法:先将全部样品当作一类,然后分成两类、三类,……,直至每个样品自成一类为止。常用一分为二的做法,其思想是每次只将一个类分成两个类,使一分为二后类内样品间的离差平方和尽可能小。设全部样品\(x_i=(x_{i1},x_{i2},\cdots,x_{ip})',i=1,\cdots,n\),所成的类为\(G\),分成两类\(G_1\),\(G_2\)。要使分成的两类的离差平方和最小,等价于使目标函数\(L(G_1,G_2)=\frac{n_1 n_2}{n}(\bar{x_1}-\bar{x_2})'(\bar{x_1}-\bar{x_2})\)达到最大。式中\(\bar{x_1}\),\(\bar{x_2}\)分别为\(G_1\),\(G_2\)的重心(即均值向量),\(n_1\),\(n_2\)分别是\(G_1\),\(G_2\)中的样品数。具体步骤:(1)将\(n\)个样品看成一类\(G\),并从中选出一个样品作为\(G_2\)类,剩下的样品作为\(G_1\)类,使目标函数\(L(n;G_1,G_2)=\frac{n_1 n_2}{n}(\bar{x_1}-\bar{x_2})'(\bar{x_1}-\bar{x_2})\)达到最大。如将\(x_{i_1}\)划入\(G_2,G_2=\left \{ x_{i_1}\right \}\),对应的目标函数值记为\(L_1\)。(2)从\(G_1\)中选第二个样品归入\(G_2\),使\(L\)极大,如\(x_{i_2}\)归入\(G_2,G_2=\left \{ x_{i_1},x_{i_2}\right \}\),对应的目标函数值记为\(L_2\)。(3)如此反复进行,直至\(G_2=\left \{ x_{i_1},x_{i_2},\cdots,x_{i_{n-1}}\right \}\),相应的目标函数值依次为\(L_1,L_2,\cdots,L_{n-1}\),然后从中选取最大的\(L\)值,如\(L_k\),则将前\(k\)次归入\(G_2\)的样品作为一类,余下的\(n-k\)个样品作为另一类\(G_1\)。(4)对\(G_1\)与\(G_2\)分别施以(1),(2),(3)的步骤,得两个相应的最大目标函数值,再取较大者对应的类分成两类,这时全部样品已分成三类。如此反复进行,直至每一个样品自成一类为止。
没有要显示的评论
没有要显示的评论