【南開】20秋學(xué)期(1709、1803、1809、1903、1909、2003、2009 )《大數(shù)據(jù)導(dǎo)論》在線作業(yè)(標(biāo)準(zhǔn)答案)

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時(shí)間:2020-10-16 22:49:30來源:admin瀏覽: 197 次

可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請(qǐng)?zhí)砑観Q:3230981406      微信:aopopenfd777





20秋學(xué)期(1709、1803、1809、1903、1909、2003、2009 )《大數(shù)據(jù)導(dǎo)論》在線作業(yè)

試卷總分:100  得分:100

一、單選題 (共 15 道試題,共 30 分)

1.大數(shù)據(jù)的特點(diǎn)不包含

A.數(shù)據(jù)體量大

B.價(jià)值密度高

C.處理速度快

D.數(shù)據(jù)不統(tǒng)一


2.大數(shù)據(jù)的最顯著特征是() 。

A.數(shù)據(jù)規(guī)模大

B.數(shù)據(jù)類型多樣

C.數(shù)據(jù)處理速度快

D.數(shù)據(jù)價(jià)值密度高


3.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是自動(dòng)的主要是來自哪個(gè)階段( )。

A.運(yùn)營式系統(tǒng)階段

B.用戶原創(chuàng)內(nèi)容階段

C.感知式系統(tǒng)階段


4.下列哪個(gè)工具常用來開發(fā)移動(dòng)友好地交互地圖()

A.Leaflet

B.Visual.ly

C.BPizza Pie Charts

D.Gephi


5.醫(yī)療健康數(shù)據(jù)的基本情況不包括以下哪項(xiàng)?

A.診療數(shù)據(jù)

B.個(gè)人健康管理數(shù)據(jù)

C.公共安全數(shù)據(jù)

D.健康檔案數(shù)據(jù)


6.數(shù)據(jù)倉庫是隨著時(shí)間變化的,下列不正確的是()

A.數(shù)據(jù)倉庫隨時(shí)間變化不斷增加新內(nèi)容

B.捕捉到的新數(shù)據(jù)會(huì)覆蓋原來的快照

C.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨時(shí)間的變化不斷進(jìn)行重新綜合


7.IaaS是()的簡稱

A.軟件即服務(wù)

B.平臺(tái)即服務(wù)

C.基礎(chǔ)設(shè)施即服務(wù)

D.硬件即服務(wù)


8.哪個(gè)選項(xiàng)不屬于大數(shù)據(jù)4V特點(diǎn)?

A.Volume

B.Valid

C.Variety

D.Value


9.第一個(gè)提出大數(shù)據(jù)概念的公司是( )。

A.麥肯錫公司

B.谷歌公司

C.微軟公司

D.臉譜公司


10.MapReduce中的Map和Reduce函數(shù)使用()進(jìn)行輸入輸出

A.key/value對(duì)

B.隨機(jī)數(shù)值

C.其他計(jì)算結(jié)果


11.數(shù)據(jù)清洗的方法不包括

A.缺失值處理

B.噪聲數(shù)據(jù)清除

C.一致性檢查

D.重復(fù)數(shù)據(jù)記錄處理


12.以下不是數(shù)據(jù)倉庫基本特征的是()

A.數(shù)據(jù)倉庫是面向主題的

B.數(shù)據(jù)倉庫是面向事務(wù)的

C.數(shù)據(jù)倉庫的數(shù)據(jù)是相對(duì)穩(wěn)定的

D.數(shù)據(jù)倉庫的數(shù)據(jù)是反映歷史變化的


13.下列不屬于Google云計(jì)算平臺(tái)技術(shù)架構(gòu)的是()

A.并行數(shù)據(jù)處理MapReduce

B.分布式鎖Chubby

C.結(jié)構(gòu)化數(shù)據(jù)表BigTable

D.彈性云計(jì)算EC2


14.下列哪個(gè)R語言擴(kuò)展包可以創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖()

A.ggplot2

B.network

C.ggmaps

D.animation


15.基礎(chǔ)設(shè)施即服務(wù)的英文簡稱是

A.IaaS

B.PaaS

C.SaaS


二、多選題 (共 15 道試題,共 30 分)

16.大數(shù)據(jù)時(shí)代預(yù)測人類移動(dòng)行為的數(shù)據(jù)特點(diǎn)是

A.多樣化

B.數(shù)據(jù)量大

C.維數(shù)高

D.變化快


17.借助于大數(shù)據(jù)提供的##和##,政府可為農(nóng)業(yè)生產(chǎn)進(jìn)行合理引導(dǎo),依據(jù)需求進(jìn)行生產(chǎn),避免產(chǎn)能過剩造成不必要的資源和社會(huì)財(cái)富浪費(fèi)。

A.消費(fèi)能力

B.趨勢報(bào)告

C.購物結(jié)果


18.關(guān)于R語言擴(kuò)展包下列正確的是()

A.network可創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖

B.animation可制作一系列的圖像并將它們串聯(lián)起來做成動(dòng)畫

C.ggmaps通過樹圖來可視化層次型數(shù)據(jù)

D.protfolio基于谷歌地圖、OpenStreetMap及其他地圖的空間數(shù)據(jù)可視化工具


19.網(wǎng)絡(luò)數(shù)據(jù)采集常用的是通過##或##等方式從網(wǎng)站上獲取數(shù)據(jù)信息。

A.網(wǎng)絡(luò)爬蟲

B.網(wǎng)站公開API

C.手動(dòng)獲取


20.數(shù)據(jù)分析的類型根據(jù)數(shù)據(jù)分析深度可以分為()

A.描述性分析

B.預(yù)測性分析s

C.規(guī)則性分析


21.數(shù)據(jù)變換(Data Transformation)的方法有()

A.光滑

B.聚集

C.數(shù)據(jù)泛化

D.規(guī)范化


22.按照數(shù)據(jù)量的大小,可將數(shù)據(jù)分析分為()

A.內(nèi)存級(jí)數(shù)據(jù)分析

B.Bl級(jí)數(shù)據(jù)分析

C.海量級(jí)數(shù)據(jù)分析

D.巨量級(jí)數(shù)據(jù)分析


23.可使用##,##,##進(jìn)行光滑。

A.最大值

B.箱中位數(shù)

C.箱邊界

D.箱均值


24.常見的分類方法有

A.決策樹

B.貝葉斯網(wǎng)絡(luò)

C.遺傳算法

D.FP算法


25.醫(yī)療大數(shù)據(jù)特點(diǎn):除了包含了大數(shù)據(jù)4個(gè)“V” 的特點(diǎn)之外還有()

A.多態(tài)性

B.時(shí)效性

C.不完整性

D.冗余性


26.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()

A.流行性疾病預(yù)防

B.慢性病健康管理

C.臨床決策支持

D.醫(yī)療器械研發(fā)


27.一個(gè)HDFS集群由一個(gè)##和##構(gòu)成。此外,還有與這兩個(gè)角色之間作為溝通橋梁的客戶端(Client)。

A.一個(gè)名字節(jié)點(diǎn)

B.若干個(gè)名字節(jié)點(diǎn)

C.一個(gè)數(shù)據(jù)節(jié)點(diǎn)

D.若干個(gè)數(shù)據(jù)節(jié)點(diǎn)


28.主流分布式計(jì)算平臺(tái)有()

A.google

B.IBM

C.baidu

D.Amazon


29.大數(shù)據(jù)存儲(chǔ)的特點(diǎn)與挑戰(zhàn)有()

A.容量問題

B.延遲問題

C.安全問題

D.成本問題


30.百度大數(shù)據(jù)引擎主要包含三大組件()

A.開放云

B.數(shù)據(jù)工廠

C.百度大腦。


三、判斷題 (共 20 道試題,共 40 分)

31.減少已分配但未使用的存儲(chǔ)容量的浪費(fèi),在分配存儲(chǔ)空間時(shí),系統(tǒng)按需分配存儲(chǔ)空間。


32.廣播變量在廣播后可以修改


33.內(nèi)存級(jí)分析適用于總數(shù)據(jù)量在集群內(nèi)存的最大級(jí)別以內(nèi)的情況,使用內(nèi)部數(shù)據(jù)庫技術(shù),適合實(shí)時(shí)業(yè)務(wù)分析需求。


34.云存儲(chǔ)中用戶需要按需付費(fèi)并使用存儲(chǔ)服務(wù)


35.云存儲(chǔ)是指通過集群應(yīng)用、網(wǎng)絡(luò)技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲(chǔ)設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問功能的一個(gè)系統(tǒng)。


36.每個(gè)變量的最大值和最小值之差稱為極差


37.數(shù)據(jù)變換(Data Transformation)就是把原始數(shù)據(jù)轉(zhuǎn)化為適合于數(shù)據(jù)挖掘的數(shù)據(jù)形式


38.利用大數(shù)據(jù)技術(shù)對(duì)電子病歷中的數(shù)字化信息進(jìn)行分析處理,既能夠讓醫(yī)生的診療有跡可循,還可以發(fā)現(xiàn)最有效的臨床路徑,從而及時(shí)為醫(yī)生提供最佳的診療建議。


39.數(shù)據(jù)集成(Data Integration)是將多個(gè)數(shù)據(jù)源中的數(shù)據(jù)合并存放到一個(gè)一致的數(shù)據(jù)存儲(chǔ)中


40.美國《自然》(Nature)雜志??猅he next google,第一次正式提出“大數(shù)據(jù)”概念。


41.用一個(gè)函數(shù)擬合數(shù)據(jù)來光滑數(shù)據(jù)稱為回歸。


42.RDD是一種自定義的可并行數(shù)據(jù)容器,可以存放任意類型的數(shù)據(jù)


43.BI分析適用于總數(shù)據(jù)量在集群內(nèi)存的最大級(jí)別以內(nèi)的情況,使用內(nèi)部數(shù)據(jù)庫技術(shù),適合實(shí)時(shí)業(yè)務(wù)分析需求。


44.云存儲(chǔ)是一個(gè)由網(wǎng)絡(luò)設(shè)備、存儲(chǔ)設(shè)備、服務(wù)器、應(yīng)用軟件、公用訪問接口、接入網(wǎng)和客戶端程序等組成的復(fù)雜系統(tǒng)。


45.軌跡數(shù)據(jù)包含空間和時(shí)間屬性,并且通常規(guī)模巨大且維度高


46.預(yù)測性分析(Predictive Analysis)用于預(yù)測未來事件發(fā)生的概率和演化趨勢


47.數(shù)據(jù)存取和共享機(jī)制是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)


48.21世紀(jì)時(shí)數(shù)據(jù)信息大發(fā)展的時(shí)代,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓寬了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大。


49.交通數(shù)據(jù)集通常包括空間和時(shí)間特性而且跨越大范圍的時(shí)間空間。數(shù)據(jù)聚類可以有效的減小數(shù)據(jù)規(guī)模為隨后的分析提供便利。


50.社交網(wǎng)絡(luò)一一通常由通過一些特定類型的相互依賴關(guān)系(例如,親屬關(guān)系、友誼、共同興趣、信念或金融交換)鏈接的社會(huì)實(shí)體(例如,個(gè)人、公司、集體社會(huì)單位或組織)組成。


作業(yè)咨詢 論文咨詢
微信客服掃一掃

回到頂部