東財(cái)《數(shù)據(jù)分析與決策》單元作業(yè)一
試卷總分:100 得分:100
一、單選題 (共 5 道試題,共 25 分)
1.( )是后續(xù)的數(shù)據(jù)轉(zhuǎn)化、模型計(jì)算的必要前提。
A.變量大小
B.變量轉(zhuǎn)換
C.變量類別
D.變量類型
2.根據(jù)數(shù)據(jù)分析的目的,需要確定每一行都是( )的實(shí)體。
A.異質(zhì)
B.同質(zhì)
C.隨意
D.有結(jié)構(gòu)
3.下列關(guān)于回歸分析說法不正確的是( )。
A.回歸分析試圖找出變量間確定的函數(shù)關(guān)系
B.回歸分析是用函數(shù)關(guān)系描述變量間關(guān)系的
C.相關(guān)關(guān)系和回歸分析不可以相互轉(zhuǎn)化
D.回歸分析在數(shù)據(jù)挖掘中被廣泛應(yīng)用,可作為預(yù)測(cè)的方法
4.在現(xiàn)實(shí)世界中一些現(xiàn)象受到許多相互獨(dú)立的隨機(jī)因素的影響,如果每個(gè)因素所產(chǎn)生的影響都很微小,總的影響可以看作是服從( )的。
A.正態(tài)分布
B.卡方分布
C.t分布
D.F分布
5.業(yè)務(wù)分析應(yīng)該為明確的( )服務(wù)。
A.企業(yè)目標(biāo)
B.計(jì)劃
C.組織目標(biāo)
D.戰(zhàn)略目標(biāo)
二、多選題 (共 5 道試題,共 25 分)
6.下列關(guān)于決策表的說法錯(cuò)誤的有( )。
A.決策表是指嘗試從模型訓(xùn)練中發(fā)現(xiàn)一些規(guī)則
B.決策樹和決策表是完全不相同的,也完全不相似
C.決策表的規(guī)則和記錄是一一對(duì)應(yīng)的
D.決策表按照規(guī)則的順序來決定規(guī)則的優(yōu)先級(jí)
7.貝葉斯網(wǎng)絡(luò)的價(jià)值主要有( )。
A.分類
B.預(yù)測(cè)
C.幫助了解因果關(guān)系
D.有效避免數(shù)據(jù)過度擬合
8.下列關(guān)于差異的說法正確的有( )。
A.偶然因素引起的差異往往是比較顯著的
B.差異的絕對(duì)值大于給定的標(biāo)準(zhǔn)的概率分布區(qū)間稱為拒絕區(qū)間
C.事件屬于接受區(qū)間則判斷總體無顯著差異
D.事件屬于拒絕區(qū)間,則認(rèn)為總體有顯著差異
9.下列關(guān)于支持向量機(jī)的理論正確的是( )。
A.支持向量機(jī)的理論基礎(chǔ)就是統(tǒng)計(jì)學(xué)習(xí)理論。
B.根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論,學(xué)習(xí)機(jī)器的實(shí)際風(fēng)險(xiǎn)由經(jīng)驗(yàn)風(fēng)險(xiǎn)值和置信范圍值兩部分組成
C.支持向量機(jī)在解決大樣本、非線性機(jī)高維模式識(shí)別問題中表現(xiàn)出許多特有的優(yōu)勢(shì)
D.線性分類器是支持向量機(jī)的基礎(chǔ)
10.數(shù)據(jù)挖掘是從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),是( )的綜合。
A.統(tǒng)計(jì)學(xué)
B.計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)
C.數(shù)據(jù)庫技術(shù)
D.人工智能技術(shù)
三、判斷題 (共 10 道試題,共 50 分)
11.最近相鄰算法中的鄰居的遠(yuǎn)近是按照距離函數(shù)計(jì)算的。( )
12.一般來講,訓(xùn)練集要包含所有可能的分類,這些分類的數(shù)目沒有任何要求。( )
13.一般來說,如果樣本容量越大,估計(jì)量會(huì)更接近總體參數(shù)。( )
14.業(yè)務(wù)分析主要特征是利用各種統(tǒng)計(jì)分析、優(yōu)化等工具實(shí)現(xiàn)決策職能化。( )
15.數(shù)據(jù)挖掘是從數(shù)據(jù)中自動(dòng)地抽取模式、關(guān)聯(lián)、變化、異常和有意義的結(jié)構(gòu)。( )
16.在前向型的神經(jīng)網(wǎng)絡(luò)中,每個(gè)輸入字段都會(huì)對(duì)應(yīng)一個(gè)輸入神經(jīng)元。( )
17.數(shù)據(jù)集中的異常數(shù)據(jù)和重復(fù)數(shù)據(jù)都可能對(duì)建模的速度和精確度造成影響。( )
18.數(shù)據(jù)可視化技術(shù)可以將所有數(shù)據(jù)的特性通過表的方式展示出來。( )
19.方差分析主要探討給定量的變量與給定因素之間的關(guān)系。( )
20.截尾均值的好處就是能減少極端值的影響,較平均值更能反映實(shí)際情況。( )