22春學(xué)期(高起本1709-1803、全層次1809-2103)《大數(shù)據(jù)導(dǎo)論》在線作業(yè)-00001
試卷總分:100 得分:100
一、單選題 (共 15 道試題,共 30 分)
1.大數(shù)據(jù)的最顯著特征是() 。
A.數(shù)據(jù)規(guī)模大
B.數(shù)據(jù)類型多樣
C.數(shù)據(jù)處理速度快
D.數(shù)據(jù)價(jià)值密度高
2.下列不屬于商業(yè)大數(shù)據(jù)類型的是
A.傳統(tǒng)企業(yè)數(shù)據(jù)
B.機(jī)器和傳感器數(shù)據(jù)
C.社交數(shù)據(jù)
D.電子商務(wù)數(shù)據(jù)
3.下面哪一項(xiàng)不是中國(guó)發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的基礎(chǔ)()。
A.信息化積累了豐富的數(shù)據(jù)資源
B.大數(shù)據(jù)技術(shù)創(chuàng)新取得明顯突破
C.大數(shù)據(jù)應(yīng)用推動(dòng)勢(shì)頭良好
D.大數(shù)據(jù)產(chǎn)業(yè)支撐薄弱
4.()是Microsoft Office的核心組件
A.SQL
B.WORD
C.PPT
D.EXCEL
5.以下不是數(shù)據(jù)倉(cāng)庫基本特征的是()
A.數(shù)據(jù)倉(cāng)庫是面向主題的
B.數(shù)據(jù)倉(cāng)庫是面向事務(wù)的
C.數(shù)據(jù)倉(cāng)庫的數(shù)據(jù)是相對(duì)穩(wěn)定的
D.數(shù)據(jù)倉(cāng)庫的數(shù)據(jù)是反映歷史變化的
6.第一個(gè)提出大數(shù)據(jù)概念的公司是( )。
A.麥肯錫公司
B.谷歌公司
C.微軟公司
D.臉譜公司
7.購(gòu)物籃問題是##的典型案例
A.數(shù)據(jù)變換
B.關(guān)聯(lián)規(guī)則挖掘
C.數(shù)據(jù)分類
8.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是被動(dòng)的主要是來自哪個(gè)階段( )。
A.運(yùn)營(yíng)式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
9.GFS中的文件切分成()的塊進(jìn)行存儲(chǔ)
A.32MB
B.64MB
C.128MB
D.1G
10.MapReduce中的Map和Reduce函數(shù)使用()進(jìn)行輸入輸出
A.key/value對(duì)
B.隨機(jī)數(shù)值
C.其他計(jì)算結(jié)果
11.哪個(gè)選項(xiàng)不屬于大數(shù)據(jù)4V特點(diǎn)?
A.Volume
B.Valid
C.Variety
D.Value
12.用于描述相等時(shí)間間隔下連續(xù)數(shù)據(jù)隨時(shí)間變化趨勢(shì)的是()
A.折線圖
B.散點(diǎn)圖
C.條形圖
D.餅圖
13.下列哪個(gè)R語言擴(kuò)展包可以創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖()
A.ggplot2
B.network
C.ggmaps
D.animation
14.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是自動(dòng)的主要是來自哪個(gè)階段( )。
A.運(yùn)營(yíng)式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
15.以下哪項(xiàng)不是數(shù)據(jù)可視化工具的特性()
A.實(shí)時(shí)性
B.簡(jiǎn)單操作
C.更豐富的展現(xiàn)
D.僅需一種數(shù)據(jù)支持方式即可
二、多選題 (共 15 道試題,共 30 分)
16.可視化工具包括()
A.Excel
B.Google Chart
C.Gephi
D.ppt
17.可使用##,##,##進(jìn)行光滑。
A.最大值
B.箱中位數(shù)
C.箱邊界
D.箱均值
18.以下可以用于數(shù)據(jù)可視化的是()。
A.R語言
B.Excel
C.RapidMiner
D.Weka
19.關(guān)于R語言擴(kuò)展包下列正確的是()
A.network可創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖
B.animation可制作一系列的圖像并將它們串聯(lián)起來做成動(dòng)畫
C.ggmaps通過樹圖來可視化層次型數(shù)據(jù)
D.protfolio基于谷歌地圖、OpenStreetMap及其他地圖的空間數(shù)據(jù)可視化工具
20.借助于大數(shù)據(jù)提供的##和##,政府可為農(nóng)業(yè)生產(chǎn)進(jìn)行合理引導(dǎo),依據(jù)需求進(jìn)行生產(chǎn),避免產(chǎn)能過剩造成不必要的資源和社會(huì)財(cái)富浪費(fèi)。
A.消費(fèi)能力
B.趨勢(shì)報(bào)告
C.購(gòu)物結(jié)果
21.下列屬于傳統(tǒng)統(tǒng)計(jì)學(xué)展示方法的是()
A.柱狀圖
B.餅狀圖
C.曲線圖
D.網(wǎng)絡(luò)圖
22.主流分布式計(jì)算平臺(tái)有()
A.google
B.IBM
C.baidu
D.Amazon
23.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()
A.流行性疾病預(yù)防
B.慢性病健康管理
C.臨床決策支持
D.醫(yī)療器械研發(fā)
24.基于大數(shù)據(jù)的臨床決策支持系統(tǒng)的架構(gòu)包括
A.支撐層
B.大數(shù)據(jù)分析層
C.網(wǎng)絡(luò)層
D.應(yīng)用層
25.數(shù)據(jù)分析的類型根據(jù)數(shù)據(jù)分析深度可以分為()
A.描述性分析
B.預(yù)測(cè)性分析s
C.規(guī)則性分析
26.大數(shù)據(jù)時(shí)代預(yù)測(cè)人類移動(dòng)行為的數(shù)據(jù)特點(diǎn)是
A.多樣化
B.數(shù)據(jù)量大
C.維數(shù)高
D.變化快
27.百度大數(shù)據(jù)引擎主要包含三大組件()
A.開放云
B.數(shù)據(jù)工廠
C.百度大腦。
28.統(tǒng)計(jì)圖表的可視化方法主要包括()
A.散點(diǎn)圖
B.折線圖
C.條形圖
D.餅圖
29.云計(jì)算是##,##,##的發(fā)展?,是虛擬化、效用計(jì)算、 IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺(tái)即服務(wù))、Saas(軟件即服務(wù))等概念混合演進(jìn)并躍升的結(jié)果。
A.流計(jì)算
B.分布式計(jì)算
C.并行計(jì)算
D.網(wǎng)絡(luò)計(jì)算
30.大數(shù)據(jù)在教育中的應(yīng)用
A.網(wǎng)上公開課
B.慕課
C.智慧校園
D.翻轉(zhuǎn)課堂
三、判斷題 (共 20 道試題,共 40 分)
31.數(shù)據(jù)的集中存儲(chǔ)增加了數(shù)據(jù)泄露風(fēng)險(xiǎn)。
32.發(fā)現(xiàn)滿足最小支持度閾值的所有項(xiàng)集,這些項(xiàng)集被稱為頻繁項(xiàng)集。
33.數(shù)據(jù)存在形式包括結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)
34.網(wǎng)絡(luò)數(shù)據(jù)采集是利用互聯(lián)網(wǎng)搜索引擎技術(shù)對(duì)數(shù)據(jù)進(jìn)行針對(duì)性、行業(yè)性、精準(zhǔn)性的抓取,并按照一定規(guī)則和篩選標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行歸類,形成數(shù)據(jù)庫文件的一個(gè)過程。
35.基于騰訊大社交平臺(tái)獨(dú)特基因,以海量用戶為基礎(chǔ),以大數(shù)據(jù)洞察為核心,以智能定向推廣為導(dǎo)向,廣點(diǎn)通提供一站式網(wǎng)絡(luò)推廣營(yíng)銷平臺(tái)。
36.原始數(shù)據(jù)的錯(cuò)誤,異常值和沖突值必須被清理。典型的數(shù)據(jù)清潔操作包含三個(gè)階段:審計(jì)數(shù)據(jù)發(fā)現(xiàn)差距,選擇轉(zhuǎn)換來修正差距,將轉(zhuǎn)換應(yīng)用到數(shù)據(jù)集。
37.在現(xiàn)有大數(shù)據(jù)的存儲(chǔ)中,結(jié)構(gòu)化數(shù)據(jù)僅有20%,其余80%則在存在于物聯(lián)網(wǎng)、電子商務(wù)、社交網(wǎng)絡(luò)等 領(lǐng)域的半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)
38.廣播變量在廣播后可以修改
39.預(yù)測(cè)性分析(Predictive Analysis)用于預(yù)測(cè)未來事件發(fā)生的概率和演化趨勢(shì)
40.數(shù)據(jù)表達(dá)是通過計(jì)算機(jī)圖形圖像技術(shù)來更加友好地展示數(shù)據(jù)信息,方便人們閱讀、理解和運(yùn)用數(shù)據(jù)
41.用戶可以容易地分析空間情況(道路網(wǎng)絡(luò)內(nèi)部)隨時(shí)間的任何變化,或分析道路段上的交通狀況的時(shí)間變化,或者利用歷史數(shù)據(jù)跟蹤單個(gè)車輛的即時(shí)狀態(tài)。
42.離群點(diǎn)檢測(cè)的任務(wù)是識(shí)別特征顯著不同于其他數(shù)據(jù)的觀測(cè)值,這樣的點(diǎn)稱為異常點(diǎn)、離群點(diǎn)或孤立點(diǎn)。
43.按照數(shù)據(jù)量的大小,可將數(shù)據(jù)分析分為內(nèi)存級(jí)數(shù)據(jù)分析、Bl級(jí)數(shù)據(jù)分析和海量級(jí)數(shù)據(jù)分析。
44.Facebook積累了超過12億全球用戶,其存儲(chǔ)了大量的用戶數(shù)據(jù),這使它成為一個(gè)巨大的“數(shù)據(jù)樂園”。人們?cè)絹碛鷥A向于在Facebook上表達(dá)自己的情緒。
45.美國(guó)奧巴馬政府宣布投資2億美元啟動(dòng)“大數(shù)據(jù)研發(fā)計(jì)劃”
46.軌跡數(shù)據(jù)包含空間和時(shí)間屬性,并且通常規(guī)模巨大且維度高
47.樹狀圖(Tree)通常用于表示層級(jí)、上下級(jí)、包含與被包含關(guān)系。
48.大數(shù)據(jù)從概念化走向價(jià)值化是大數(shù)據(jù)的發(fā)展趨勢(shì)
49.時(shí)空數(shù)據(jù)可視化與地理制圖學(xué)相結(jié)合,重點(diǎn)對(duì)時(shí)間與空間維度,以及與之相關(guān)的信息對(duì)象屬性建立可視化表征,對(duì)與時(shí)間和空間密切相關(guān)的模式及規(guī)律進(jìn)行展示
50.大數(shù)據(jù)數(shù)據(jù)量一定是PB,TB級(jí)的