東財《數(shù)據(jù)分析與決策》單元作業(yè)二
試卷總分:100 得分:100
一、單選題 (共 4 道試題,共 20 分)
1.兩步聚類算法是一種( )算法。
A.分層聚類
B.K均值聚類
C.凝聚聚類
D.Kohonen network
2.CARMA算法只需要對數(shù)據(jù)進行( )次掃描就可以獲得比Apriori算法更低的支持度的結(jié)果。
A.一
B.兩
C.三
D.四
3.通常,我們期望聚類的數(shù)量不能( )。
A.太多
B.太少
C.固定
D.太隨機
4.對于簡單指數(shù)平滑法的模型,當(dāng)( )時,表示模型更具有惰性。
A.α=0
B.α=1
C.α>0
D.α<0
二、多選題 (共 8 道試題,共 40 分)
5.衡量關(guān)聯(lián)規(guī)則強弱的指標主要有( )。
A.支持度
B.置信度
C.相似度
D.提升度
6.決定選擇何種時間序列分析法的原則包括( )。
A.要解決的問題
B.目的
C.時間
D.時間序列數(shù)據(jù)的特點
7.時間序列的特征主要有( )。
A.趨勢
B.季節(jié)性周期性變化
C.連續(xù)值
D.離群值
8.K均值聚類算法的基本思想包括( )。
A.首先,隨機選擇K個對象,每個對象初始的代表了一個簇的均值
B.對剩余的每個對象,根據(jù)其與各個簇中心的距離,將它賦給最近的簇
C.然后重新計算每個簇的平均值
D.這個過程不斷重復(fù),直到準則函數(shù)收斂
9.K均值聚類算法的輸入包括( )。
A.聚類個數(shù)K
B.初始中心
C.n個數(shù)據(jù)對象
D.方差
10.發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的步驟是( )。
A.預(yù)選指定一個最小支持度計數(shù)閾值
B.找到所有超過這個值的項目集
C.從頻繁項目集中產(chǎn)生強關(guān)聯(lián)規(guī)則
D.從頻繁項目集中產(chǎn)生弱關(guān)聯(lián)規(guī)則
11.分層聚類可細分為( )。
A.凝聚聚類
B.兩步聚類
C.分裂聚類
D.K均值聚類
12.考察聚類內(nèi)的特征主要有( )。
A.標準差
B.聚類半徑
C.SSE
D.SSB
三、判斷題 (共 8 道試題,共 40 分)
13.從數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的問題可以轉(zhuǎn)變?yōu)榘l(fā)現(xiàn)頻繁項目集。( )
14.分層聚類是嘗試建立分層以達到聚類的一類算法。( )
15.當(dāng)提升度小于1時表明其中一個項集的出現(xiàn)降低了另一個項集出現(xiàn)的可能性。( )
16.移動平均模型描述的是自回歸部分的誤差累計。( )
17.計算聚類內(nèi)的每個點至聚類中心點的距離平均值,如果聚類平均值過小,則說明這個聚類需要進一步分割。( )
18.如果當(dāng)前時間點的值需要通過前兩個時間點值的回歸加上隨機誤差來計算,則稱之為二階自回歸AR(2)。( )
19.時間序列中帶有趨勢和季節(jié)性因素都會給時間序列的分析和預(yù)測帶來麻煩。( )
20.Apriori算法使用標準的發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的步驟,先發(fā)現(xiàn)數(shù)據(jù)中的頻繁項目集,然后從中產(chǎn)生關(guān)聯(lián)規(guī)則。( )
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學(xué)習(xí)
詳情請咨詢QQ : 3230981406或微信:aopopenfd777