可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請(qǐng)?zhí)砑観Q:3230981406 微信:aopopenfd777
20秋學(xué)期(1709、1803、1809、1903、1909、2003、2009 )《大數(shù)據(jù)導(dǎo)論》在線作業(yè)
試卷總分:100 得分:100
一、單選題 (共 15 道試題,共 30 分)
1.大數(shù)據(jù)的特點(diǎn)不包含
A.數(shù)據(jù)體量大
B.價(jià)值密度高
C.處理速度快
D.數(shù)據(jù)不統(tǒng)一
2.大數(shù)據(jù)的最顯著特征是() 。
A.數(shù)據(jù)規(guī)模大
B.數(shù)據(jù)類型多樣
C.數(shù)據(jù)處理速度快
D.數(shù)據(jù)價(jià)值密度高
3.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是自動(dòng)的主要是來自哪個(gè)階段( )。
A.運(yùn)營式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
4.下列哪個(gè)工具常用來開發(fā)移動(dòng)友好地交互地圖()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
5.醫(yī)療健康數(shù)據(jù)的基本情況不包括以下哪項(xiàng)?
A.診療數(shù)據(jù)
B.個(gè)人健康管理數(shù)據(jù)
C.公共安全數(shù)據(jù)
D.健康檔案數(shù)據(jù)
6.數(shù)據(jù)倉庫是隨著時(shí)間變化的,下列不正確的是()
A.數(shù)據(jù)倉庫隨時(shí)間變化不斷增加新內(nèi)容
B.捕捉到的新數(shù)據(jù)會(huì)覆蓋原來的快照
C.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容
D.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨時(shí)間的變化不斷進(jìn)行重新綜合
7.IaaS是()的簡稱
A.軟件即服務(wù)
B.平臺(tái)即服務(wù)
C.基礎(chǔ)設(shè)施即服務(wù)
D.硬件即服務(wù)
8.哪個(gè)選項(xiàng)不屬于大數(shù)據(jù)4V特點(diǎn)?
A.Volume
B.Valid
C.Variety
D.Value
9.第一個(gè)提出大數(shù)據(jù)概念的公司是( )。
A.麥肯錫公司
B.谷歌公司
C.微軟公司
D.臉譜公司
10.MapReduce中的Map和Reduce函數(shù)使用()進(jìn)行輸入輸出
A.key/value對(duì)
B.隨機(jī)數(shù)值
C.其他計(jì)算結(jié)果
11.數(shù)據(jù)清洗的方法不包括
A.缺失值處理
B.噪聲數(shù)據(jù)清除
C.一致性檢查
D.重復(fù)數(shù)據(jù)記錄處理
12.以下不是數(shù)據(jù)倉庫基本特征的是()
A.數(shù)據(jù)倉庫是面向主題的
B.數(shù)據(jù)倉庫是面向事務(wù)的
C.數(shù)據(jù)倉庫的數(shù)據(jù)是相對(duì)穩(wěn)定的
D.數(shù)據(jù)倉庫的數(shù)據(jù)是反映歷史變化的
13.下列不屬于Google云計(jì)算平臺(tái)技術(shù)架構(gòu)的是()
A.并行數(shù)據(jù)處理MapReduce
B.分布式鎖Chubby
C.結(jié)構(gòu)化數(shù)據(jù)表BigTable
D.彈性云計(jì)算EC2
14.下列哪個(gè)R語言擴(kuò)展包可以創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖()
A.ggplot2
B.network
C.ggmaps
D.animation
15.基礎(chǔ)設(shè)施即服務(wù)的英文簡稱是
A.IaaS
B.PaaS
C.SaaS
二、多選題 (共 15 道試題,共 30 分)
16.大數(shù)據(jù)時(shí)代預(yù)測人類移動(dòng)行為的數(shù)據(jù)特點(diǎn)是
A.多樣化
B.數(shù)據(jù)量大
C.維數(shù)高
D.變化快
17.借助于大數(shù)據(jù)提供的##和##,政府可為農(nóng)業(yè)生產(chǎn)進(jìn)行合理引導(dǎo),依據(jù)需求進(jìn)行生產(chǎn),避免產(chǎn)能過剩造成不必要的資源和社會(huì)財(cái)富浪費(fèi)。
A.消費(fèi)能力
B.趨勢報(bào)告
C.購物結(jié)果
18.關(guān)于R語言擴(kuò)展包下列正確的是()
A.network可創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖
B.animation可制作一系列的圖像并將它們串聯(lián)起來做成動(dòng)畫
C.ggmaps通過樹圖來可視化層次型數(shù)據(jù)
D.protfolio基于谷歌地圖、OpenStreetMap及其他地圖的空間數(shù)據(jù)可視化工具
19.網(wǎng)絡(luò)數(shù)據(jù)采集常用的是通過##或##等方式從網(wǎng)站上獲取數(shù)據(jù)信息。
A.網(wǎng)絡(luò)爬蟲
B.網(wǎng)站公開API
C.手動(dòng)獲取
20.數(shù)據(jù)分析的類型根據(jù)數(shù)據(jù)分析深度可以分為()
A.描述性分析
B.預(yù)測性分析s
C.規(guī)則性分析
21.數(shù)據(jù)變換(Data Transformation)的方法有()
A.光滑
B.聚集
C.數(shù)據(jù)泛化
D.規(guī)范化
22.按照數(shù)據(jù)量的大小,可將數(shù)據(jù)分析分為()
A.內(nèi)存級(jí)數(shù)據(jù)分析
B.Bl級(jí)數(shù)據(jù)分析
C.海量級(jí)數(shù)據(jù)分析
D.巨量級(jí)數(shù)據(jù)分析
23.可使用##,##,##進(jìn)行光滑。
A.最大值
B.箱中位數(shù)
C.箱邊界
D.箱均值
24.常見的分類方法有
A.決策樹
B.貝葉斯網(wǎng)絡(luò)
C.遺傳算法
D.FP算法
25.醫(yī)療大數(shù)據(jù)特點(diǎn):除了包含了大數(shù)據(jù)4個(gè)“V” 的特點(diǎn)之外還有()
A.多態(tài)性
B.時(shí)效性
C.不完整性
D.冗余性
26.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()
A.流行性疾病預(yù)防
B.慢性病健康管理
C.臨床決策支持
D.醫(yī)療器械研發(fā)
27.一個(gè)HDFS集群由一個(gè)##和##構(gòu)成。此外,還有與這兩個(gè)角色之間作為溝通橋梁的客戶端(Client)。
A.一個(gè)名字節(jié)點(diǎn)
B.若干個(gè)名字節(jié)點(diǎn)
C.一個(gè)數(shù)據(jù)節(jié)點(diǎn)
D.若干個(gè)數(shù)據(jù)節(jié)點(diǎn)
28.主流分布式計(jì)算平臺(tái)有()
A.google
B.IBM
C.baidu
D.Amazon
29.大數(shù)據(jù)存儲(chǔ)的特點(diǎn)與挑戰(zhàn)有()
A.容量問題
B.延遲問題
C.安全問題
D.成本問題
30.百度大數(shù)據(jù)引擎主要包含三大組件()
A.開放云
B.數(shù)據(jù)工廠
C.百度大腦。
三、判斷題 (共 20 道試題,共 40 分)
31.減少已分配但未使用的存儲(chǔ)容量的浪費(fèi),在分配存儲(chǔ)空間時(shí),系統(tǒng)按需分配存儲(chǔ)空間。
32.廣播變量在廣播后可以修改
33.內(nèi)存級(jí)分析適用于總數(shù)據(jù)量在集群內(nèi)存的最大級(jí)別以內(nèi)的情況,使用內(nèi)部數(shù)據(jù)庫技術(shù),適合實(shí)時(shí)業(yè)務(wù)分析需求。
34.云存儲(chǔ)中用戶需要按需付費(fèi)并使用存儲(chǔ)服務(wù)
35.云存儲(chǔ)是指通過集群應(yīng)用、網(wǎng)絡(luò)技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲(chǔ)設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問功能的一個(gè)系統(tǒng)。
36.每個(gè)變量的最大值和最小值之差稱為極差
37.數(shù)據(jù)變換(Data Transformation)就是把原始數(shù)據(jù)轉(zhuǎn)化為適合于數(shù)據(jù)挖掘的數(shù)據(jù)形式
38.利用大數(shù)據(jù)技術(shù)對(duì)電子病歷中的數(shù)字化信息進(jìn)行分析處理,既能夠讓醫(yī)生的診療有跡可循,還可以發(fā)現(xiàn)最有效的臨床路徑,從而及時(shí)為醫(yī)生提供最佳的診療建議。
39.數(shù)據(jù)集成(Data Integration)是將多個(gè)數(shù)據(jù)源中的數(shù)據(jù)合并存放到一個(gè)一致的數(shù)據(jù)存儲(chǔ)中
40.美國《自然》(Nature)雜志??猅he next google,第一次正式提出“大數(shù)據(jù)”概念。
41.用一個(gè)函數(shù)擬合數(shù)據(jù)來光滑數(shù)據(jù)稱為回歸。
42.RDD是一種自定義的可并行數(shù)據(jù)容器,可以存放任意類型的數(shù)據(jù)
43.BI分析適用于總數(shù)據(jù)量在集群內(nèi)存的最大級(jí)別以內(nèi)的情況,使用內(nèi)部數(shù)據(jù)庫技術(shù),適合實(shí)時(shí)業(yè)務(wù)分析需求。
44.云存儲(chǔ)是一個(gè)由網(wǎng)絡(luò)設(shè)備、存儲(chǔ)設(shè)備、服務(wù)器、應(yīng)用軟件、公用訪問接口、接入網(wǎng)和客戶端程序等組成的復(fù)雜系統(tǒng)。
45.軌跡數(shù)據(jù)包含空間和時(shí)間屬性,并且通常規(guī)模巨大且維度高
46.預(yù)測性分析(Predictive Analysis)用于預(yù)測未來事件發(fā)生的概率和演化趨勢
47.數(shù)據(jù)存取和共享機(jī)制是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)
48.21世紀(jì)時(shí)數(shù)據(jù)信息大發(fā)展的時(shí)代,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓寬了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大。
49.交通數(shù)據(jù)集通常包括空間和時(shí)間特性而且跨越大范圍的時(shí)間空間。數(shù)據(jù)聚類可以有效的減小數(shù)據(jù)規(guī)模為隨后的分析提供便利。
50.社交網(wǎng)絡(luò)一一通常由通過一些特定類型的相互依賴關(guān)系(例如,親屬關(guān)系、友誼、共同興趣、信念或金融交換)鏈接的社會(huì)實(shí)體(例如,個(gè)人、公司、集體社會(huì)單位或組織)組成。