22秋學(xué)期(高起本1709-1803、全層次1809-2103)《并行程序設(shè)計》在線作業(yè)
試卷總分:100 得分:100
一、單選題 (共 50 道試題,共 100 分)
1.現(xiàn)代CPU中都具有指令亂序執(zhí)行功能,其目的不包括____。
A.消除指令依賴,更充分利用多流水線
B.提高cache效率
C.改變計算結(jié)果
D.消除資源沖突
2.編寫矩陣乘法的Neon程序,若矩陣元素為雙精度浮點數(shù),則應(yīng)對矩陣乘—加計算的循環(huán)進行____路循環(huán)展開。
A.2
B.4
C.8
D.16
3.C/C++語言存儲二維數(shù)組采取____。
A.行主次序存儲
B.列主次序存儲
C.交錯式存儲
D.對角線存儲
4.MPI收發(fā)各一條消息的API是_____。
A.MPI_Sendrecv
B.MPI_Send
C.MPI_Recv
D.MPI_Replace
5.以下____是MPI基本原語。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
6.MPI是用于____系統(tǒng)的并行編程模型。
A.SIMD
B.MISD
C.共享內(nèi)存
D.分布式內(nèi)存
7.SSE的blend指令的8位二進制整數(shù)參數(shù)被用做8個掩碼imm8[0:7],若imm8[j]=1則表示___。
A.將第一個源寄存器的第j個元素放在目標寄存器位置1
B.將第二個源寄存器的第j個元素放在目標寄存器位置1
C.將第一個源寄存器的第j個元素放在目標寄存器位置j
D.將第二個源寄存器的第j個元素放在目標寄存器位置j
8.在矩陣乘法之前將第二個矩陣轉(zhuǎn)置,其作用不包括____。
A.增大訪存空間局部性
B.減少運算次數(shù)
C.優(yōu)化SIMD訪存
D.以上皆錯
9.一個Neon寄存器最多存放____個整型數(shù)。
A.2
B.4
C.8
D.16
10.OpenMP歸約指令采用的是一種____算法。
A.分治
B.貪心
C.動態(tài)規(guī)劃
D.排序
11.任務(wù)依賴圖中頂點權(quán)重之和表示____。
A.任務(wù)數(shù)
B.任務(wù)難度
C.串行執(zhí)行時間
D.并行執(zhí)行時間
12.當處理器數(shù)量不變時,隨著問題規(guī)模增大,加速比____。
A.所有算法都增大
B.所有算法都減小
C.代價最優(yōu)算法都增大
D.代價最優(yōu)算法都減小
13.在下面問題中,SIMD并行最不適合____。
A.向量加法
B.向量中元素排序
C.矩陣向量乘法
D.矩陣加法
14.在128位的SIMD寄存器中,我們不能保存____。
A.16個8位整數(shù)
B.8個16位短整型
C.4個32位整型
D.16個字符的字符串
15.在超市的顧客購買商品記錄中統(tǒng)計一些商品組合的購買頻率,將購買頻率(商品組合)劃分給不同進程,這是一種劃分____的數(shù)據(jù)并行策略。
A.輸入數(shù)據(jù)
B.中間結(jié)果
C.輸出數(shù)據(jù)
D.臨時數(shù)據(jù)
16.SIMD并行化時遇到對齊問題,高效的處理方法是____。
A.直接使用SIMD不對齊訪存指令
B.將數(shù)據(jù)拷貝到對齊的內(nèi)存地址
C.重寫算法保證對齊訪問
D.串行處理到對齊邊界,然后進行SIMD對齊訪存
17.采用MPI主從模型解決矩陣每行排序問題,主進程每次向一個從進程發(fā)送10行作為一個任務(wù)相對于每次發(fā)送1行的優(yōu)點是____。
A.更有利于負載均衡
B.減少了通信開銷
C.降低了計算次數(shù)
D.減少了從進程空閑
18.對于障礙同步機制,以下說法錯誤的是____。
A.SIMD架構(gòu)無需障礙機制
B.是一種群體同步機制
C.可用信號量實現(xiàn)
D.無法用其他同步機制實現(xiàn)
19.OpenMP編譯指示中說明私有變量是用____子句。
A.private
B.shared
C.schedule
D.nowait
20.靜態(tài)線程編程模式的優(yōu)點是____。
A.線程負載均衡
B.線程通信效率高
C.線程管理開銷低
D.系統(tǒng)資源利用率高
21.指定線程間劃分循環(huán)策略的OpenMP子句是____。
A.shared
B.reduction
C.schedule
D.nowait
22.一個Neon寄存器最多存放____個單精度浮點數(shù)。
A.2
B.4
C.8
D.16
23.對于加速比S和處理器數(shù)量p,下列說法正確的是____。
A.有可能S>p
B.必然S<p
C.不可能S=p
D.兩者無關(guān)聯(lián)
24.Pthread是_____線程接口標準。
A.Linux
B.POSIX
C.Windows
D.IOS
25.OpenMP默認采用____循環(huán)劃分策略。
A.靜態(tài)
B.固定
C.動態(tài)
D.自適應(yīng)
26.動態(tài)任務(wù)劃分相對于靜態(tài)任務(wù)劃分的優(yōu)點是____。
A.確保負載均衡
B.通信開銷低
C.實現(xiàn)簡單
D.計算復(fù)雜度低
27.Pthread不支持____。
A.創(chuàng)建并發(fā)執(zhí)行線程
B.同步
C.非顯式通信
D.自動并行化
28.在用pthread_mutex_trylock對互斥量進行加鎖時,若其已上鎖,則線程進入____狀態(tài)。
A.初始化
B.阻塞
C.繼續(xù)執(zhí)行
D.銷毀
29.對于搜索分解,下面哪個說法是錯誤的_____。
A.所有子樹搜索任務(wù)都必須全部完成
B.工作量可能大于串行計算
C.工作量可能小于串行計算
D.可能產(chǎn)生超線性加速比
30.兩個矩陣相乘,當矩陣規(guī)模大于cache大小時,平凡算法的問題是____。
A.第一個矩陣訪存時間局部性差
B.第一個矩陣訪存空間局部性差
C.第二個矩陣訪存時間局部性差
D.第二個矩陣訪存空間局部性差
31.起泡排序改為奇偶轉(zhuǎn)置排序,消除了循環(huán)步間的數(shù)據(jù)依賴的原因是____。
A.增大了元素比較距離
B.減小了元素比較距離
C.改為元素兩兩分組比較
D.消除了元素比較
32.利用cache line一次讀取多個數(shù)據(jù)字的機制優(yōu)化程序訪存性能,其機理是____。
A.降低了訪存延遲
B.隱藏了訪存延遲
C.利用了cache空間局部性
D.利用了cache時間局部性
33.多對多廣播/歸約高效算法基于____。
A.遞歸思想
B.流水線思想
C.分治思想
D.貪心思想
34.并行算法加速比的定義是____。
A.并行時間/串行時間
B.串行時間/并行時間
C.串行時間-并行時間
D.(串行時間-并行時間)/并行時間
35.在條件成立時使用pthread_cond_signal____。
A.喚醒等待線程
B.解鎖互斥量
C.加鎖互斥量
D.喚醒等待線程,該線程重新加鎖互斥量
36.下面說法錯誤的是____。
A.不存在權(quán)威的并行體系結(jié)構(gòu)
B.學(xué)習(xí)并行程序設(shè)計只關(guān)心軟件即可
C.并行體系結(jié)構(gòu)對性能有巨大影響
D.很多并行體系結(jié)構(gòu)未來發(fā)展不明了
37.編寫n個數(shù)求和的OpenMP程序,最高效的方法是____。
A.多線程直接并發(fā)累加到共享變量
B.將累加操作設(shè)置為臨界區(qū)
C.在累加操作前設(shè)置障礙
D.采用歸約指令
38.對矩陣乘法串行程序的主體三重循環(huán),我們選擇最內(nèi)層循環(huán)進行向量化的原因是____。
A.它最后執(zhí)行
B.外層循環(huán)中沒有計算操作
C.是隨意選擇的
D.它的連續(xù)循環(huán)步是對不同元素進行相同運算
39.SSE寄存器A中元素為A1 A2 A3 A4(均為由低到高),則執(zhí)行C=shuffle(A, A, 0x1B)后,C中元素為
A.A1 A2 A3 A4
B.A2 A1 A4 A3
C.A3 A4 A1 A2
D.A4 A3 A2 A1
40.SSE是____平臺的SIMD架構(gòu)。
A.x86
B.POWER
C.SPARC
D.ARM
41.如果運算結(jié)果要保存到獨立無關(guān)的變量,則在向量運算之后需要進行的一個操作是____。
A.對齊
B.打包
C.解包
D.以上皆錯
42.對于條件變量,下列說法錯誤的是____。
A.可以用互斥量實現(xiàn)相同功能
B.不能用互斥量實現(xiàn)相同功能
C.較之互斥量方案節(jié)省資源
D.較之互斥量方案代碼更簡潔
43.記并行時間為T,串行時間為T’,處理器數(shù)量為p,并行代價的定義是____。
A.pT
B.T’+T
C.p(T’-T)
D.pT-T’
44.采用多核、眾核技術(shù)提升CPU性能,相對于單核的優(yōu)勢不包括____。
A.架構(gòu)設(shè)計更容易
B.更易突破物理極限
C.能更充分利用現(xiàn)有資源
D.功耗優(yōu)勢明顯
45.SSE intrinsics _mm_store_sd命令的功能是____。
A.對齊向量存單精度浮點數(shù)
B.未對齊向量存單精度浮點數(shù)
C.對齊標量存雙精度浮點數(shù)
D.未對齊標量存雙精度浮點數(shù)
46.使用____無法直接實現(xiàn)“主線程喚醒4個從線程去執(zhí)行任務(wù)”。
A.1個信號量
B.障礙
C.1個互斥量
D.4個互斥量
47.n個節(jié)點的線性陣列中,節(jié)點最遠通信距離為____。
A.1
B.O(logn)
C.O(sqrt(n))
D.O(n)
48.對矩陣乘法串行程序主體三重循環(huán)的最內(nèi)層循環(huán)進行向量化,則該循環(huán)執(zhí)行完畢后,就計算出了結(jié)果矩陣的一個元素,這種說法是____。
A.正確的
B.錯誤的
49.數(shù)據(jù)依賴是指必須保持兩個內(nèi)存操作的____才能保證程序結(jié)果正確。
A.大小
B.時序
C.時長
D.cache局部性
50.OpenMP并行模型是一種____模式。
A.SISD
B.SIMD
C.MISD
D.SPMD
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學(xué)習(xí)
詳情請咨詢QQ : 3230981406或微信:aopopenfd777