南開大學(xué)-20春學(xué)期(1709、1803、1809、1903、1909、2003)《大數(shù)據(jù)導(dǎo)論》在線作業(yè)
試卷總分:100 得分:100
一、單選題 (共 15 道試題,共 30 分)
1.大數(shù)據(jù)的特點不包含
A.數(shù)據(jù)體量大
B.數(shù)據(jù)不統(tǒng)一
C.處理速度快
D.價值密度高
2.基礎(chǔ)設(shè)施即服務(wù)的英文簡稱是
A.SaaS
B.PaaS
C.IaaS
3.下面哪一項不是中國發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的基礎(chǔ)()。
A.大數(shù)據(jù)技術(shù)創(chuàng)新取得明顯突破
B.大數(shù)據(jù)應(yīng)用推動勢頭良好
C.大數(shù)據(jù)產(chǎn)業(yè)支撐薄弱
D.信息化積累了豐富的數(shù)據(jù)資源
4.數(shù)據(jù)清洗的方法不包括
A.重復(fù)數(shù)據(jù)記錄處理
B.缺失值處理
C.噪聲數(shù)據(jù)清除
D.一致性檢查
5.以下不是數(shù)據(jù)倉庫基本特征的是()
A.數(shù)據(jù)倉庫的數(shù)據(jù)是相對穩(wěn)定的
B.數(shù)據(jù)倉庫的數(shù)據(jù)是反映歷史變化的
C.數(shù)據(jù)倉庫是面向事務(wù)的
D.數(shù)據(jù)倉庫是面向主題的
6.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是被動的主要是來自哪個階段( )。
A.運營式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
7.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是自動的主要是來自哪個階段( )。
A.運營式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
8.數(shù)據(jù)倉庫是隨著時間變化的,下列不正確的是()
A.數(shù)據(jù)倉庫隨時間變化不斷增加新內(nèi)容
B.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容
C.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨時間的變化不斷進(jìn)行重新綜合
D.捕捉到的新數(shù)據(jù)會覆蓋原來的快照
9.購物籃問題是##的典型案例
A.數(shù)據(jù)變換
B.數(shù)據(jù)分類
C.關(guān)聯(lián)規(guī)則挖掘
10.PaaS是()的簡稱
A.軟件即服務(wù)
B.硬件即服務(wù)
C.平臺即服務(wù)
D.基礎(chǔ)設(shè)施即服務(wù)
11.下列哪個R語言擴(kuò)展包可以制作一系列的圖像并將它們串聯(lián)起來做成動畫()
A.network
B.ggplot2
C.ggmaps
D.animation
12.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是主動的主要是來自哪個階段( )。
A.運營式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
13.哪個選項不屬于大數(shù)據(jù)4V特點?
A.Volume
B.Variety
C.Value
D.Valid
14.以下哪項不是數(shù)據(jù)可視化工具的特性()
A.簡單操作
B.更豐富的展現(xiàn)
C.實時性
D.僅需一種數(shù)據(jù)支持方式即可
15.()是Microsoft Office的核心組件
A.WORD
B.SQL
C.PPT
D.EXCEL
二、多選題 (共 15 道試題,共 30 分)
16.云計算的特點是()
A.高擴(kuò)展性
B.虛擬化
C.按需分配
D.大規(guī)模
17.大數(shù)據(jù)時代預(yù)測人類移動行為的數(shù)據(jù)來源有
A.裝有導(dǎo)航設(shè)備的出租車軌跡數(shù)據(jù)
B.社會網(wǎng)絡(luò)簽到數(shù)據(jù)
C.手機(jī)終端定位于通訊記錄
D.志愿者定位數(shù)據(jù)
18.百度大數(shù)據(jù)引擎主要包含三大組件()
A.百度大腦。
B.數(shù)據(jù)工廠
C.開放云
19.KNIME(Konstanz Information Miner)是一個對用戶友好的、智能、開源的平臺。該平臺包括了##、##、##、##。
A.數(shù)據(jù)集成
B.數(shù)據(jù)挖掘
C.數(shù)據(jù)處理
D.數(shù)據(jù)分析
20.大數(shù)據(jù)時代預(yù)測人類移動行為的數(shù)據(jù)特點是
A.維數(shù)高
B.數(shù)據(jù)量大
C.多樣化
D.變化快
21.大數(shù)據(jù)采集主要包括()四種。
A.網(wǎng)絡(luò)數(shù)據(jù)采集
B.系統(tǒng)日志采集
C.數(shù)據(jù)庫采集
D.其他數(shù)據(jù)采集
22.數(shù)據(jù)工廠包括
A.超強(qiáng)云安全
B.超大規(guī)模講分布式架構(gòu)
C.新一代智能自動化運維
D.低能耗數(shù)據(jù)中心
23.數(shù)據(jù)分析的類型根據(jù)數(shù)據(jù)分析深度可以分為()
A.預(yù)測性分析s
B.規(guī)則性分析
C.描述性分析
24.主流分布式計算平臺有()
A.google
B.baidu
C.IBM
D.Amazon
25.交通數(shù)據(jù)分析可用于:
A.實時路況查詢播報
B.合理進(jìn)行道路規(guī)劃
C.信號燈智能調(diào)度
D.交通流量實時分析
26.互連網(wǎng)上出現(xiàn)的海量信息可以劃分為三種,分別為( )
A.非結(jié)構(gòu)化信息
B.結(jié)構(gòu)化信息
C.特殊化信息
D.半結(jié)構(gòu)化信息
27.一個HDFS集群由一個##和##構(gòu)成。此外,還有與這兩個角色之間作為溝通橋梁的客戶端(Client)。
A.若干個數(shù)據(jù)節(jié)點
B.若干個名字節(jié)點
C.一個數(shù)據(jù)節(jié)點
D.一個名字節(jié)點
28.大數(shù)據(jù)在社交網(wǎng)絡(luò)中的應(yīng)用
A.預(yù)測外部趨勢
B.輿情監(jiān)控、突發(fā)事件預(yù)警
C.用戶畫像、精準(zhǔn)推薦
D.用戶偏好、情感、社交網(wǎng)絡(luò)結(jié)構(gòu)
29.開放云()
A.組織流程:應(yīng)用跨部門,缺乏流程貫串和使能業(yè)務(wù)生產(chǎn)
B.生態(tài)建設(shè):無法有效構(gòu)建和融入新的數(shù)字生態(tài)圈
C.應(yīng)用建設(shè):周期長、門檻高、多冗余、體驗差
D.價值呈現(xiàn):大數(shù)據(jù)應(yīng)用價值呈現(xiàn)和創(chuàng)新不足
30.大數(shù)據(jù)在電信中的應(yīng)用有
A.精準(zhǔn)的客戶分析及營銷
B.基于用戶、業(yè)務(wù)及流量分級的多維管控機(jī)制
C.利用位置和軌跡信息服務(wù)社會
三、判斷題 (共 20 道試題,共 40 分)
31.數(shù)據(jù)存在形式包括結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)
32.數(shù)據(jù)可視化。將大型數(shù)據(jù)集中的數(shù)據(jù)通過圖形圖像方式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息。
33.Spark是基于內(nèi)存的大數(shù)據(jù)并行計算框架
34.非結(jié)構(gòu)化數(shù)據(jù)是指非純文本類數(shù)據(jù),沒有標(biāo)準(zhǔn)格式,無法直接解析出相應(yīng)的值
35.箱式圖用于描述數(shù)據(jù)的分散情況,主要數(shù)據(jù)節(jié)點包括:均值、中值、等中心值的度 量,標(biāo)準(zhǔn)偏差、方差等可變性度量。
36.Pentaho是最流行的開源商業(yè)智能軟件之一
37.網(wǎng)絡(luò)數(shù)據(jù)采集是利用互聯(lián)網(wǎng)搜索引擎技術(shù)對數(shù)據(jù)進(jìn)行針對性、行業(yè)性、精準(zhǔn)性的抓取,并按照一定規(guī)則和篩選標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行歸類,形成數(shù)據(jù)庫文件的一個過程。
38.云存儲不僅是存儲設(shè)備或技術(shù),更是一種服務(wù)的創(chuàng)新。
39.當(dāng)數(shù)據(jù)量表完全超過BI和傳統(tǒng)關(guān)系數(shù)據(jù)庫的能力時,我們將用到海量數(shù)據(jù)分析。
40.IDC給出的大數(shù)據(jù)定義是大數(shù)據(jù)(Big Data)是需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
41.Paas:軟件即服務(wù)。它是一種通過Internet提供軟件的模式,用戶無需購買軟件,而是向提供商租用基于Web的軟件,來管理企業(yè)經(jīng)營活動。
42.關(guān)聯(lián)分析是在數(shù)據(jù)集D中找出大于用戶所給定的最大支持度閾值和最大置信度閾值的關(guān)聯(lián)規(guī)則。
43.數(shù)據(jù)的大量聚集,使得黑客一次成功的攻擊能夠獲得更多的數(shù)據(jù),無形中降低了黑客的進(jìn)攻成本,增加了“收益率“。
44.數(shù)據(jù)采集,又稱數(shù)據(jù)獲取,是大數(shù)據(jù)生命周期的第一個環(huán)節(jié),通過RFID射頻識別技術(shù),傳感器,交互型社交網(wǎng)絡(luò),移動互聯(lián)網(wǎng)等方式獲得的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化的海量數(shù)據(jù)。
45.社交網(wǎng)絡(luò)一一通常由通過一些特定類型的相互依賴關(guān)系(例如,親屬關(guān)系、友誼、共同興趣、信念或金融交換)鏈接的社會實體(例如,個人、公司、集體社會單位或組織)組成。
46.數(shù)據(jù)表達(dá)是通過計算機(jī)圖形圖像技術(shù)來更加友好地展示數(shù)據(jù)信息,方便人們閱讀、理解和運用數(shù)據(jù)
47.時空數(shù)據(jù)是指帶有地理位置與時間標(biāo)簽的數(shù)據(jù)。
48.大數(shù)據(jù)從概念化走向價值化是大數(shù)據(jù)的發(fā)展趨勢
49.大數(shù)據(jù)的應(yīng)用之一是,促進(jìn)健康管理的個性化和多元化。
50.FP-growth算法需要對數(shù)據(jù)庫進(jìn)行三次掃描