22春學(xué)期(高起本1709-1803、全層次1809-2103)《并行程序設(shè)計》在線作業(yè)-00002
試卷總分:100 得分:100
一、單選題 (共 50 道試題,共 100 分)
1.對單精度浮點計算,MMX最高實現(xiàn)____路并行。
A.2
B.4
C.8
D.16
2.從線程檢查主線程是否要求它退出應(yīng)采用____。
A.pthread_join
B.pthread_cancel
C.pthread_testcancel
D.pthread_exit
3.條件變量相對于互斥量的優(yōu)點是____。
A.是多源狀態(tài)
B.加鎖解鎖開銷低
C.條件不成立時阻塞線程并自動解鎖加鎖
D.以上皆錯
4.編寫矩陣乘法的SSE程序,若矩陣元素為單精度浮點數(shù),則應(yīng)對矩陣乘—加計算的循環(huán)進(jìn)行____路循環(huán)展開。
A.2
B.4
C.8
D.16
5.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系統(tǒng)向量化訪存是按16字節(jié)對齊的,則此向量化程序每個循環(huán)步產(chǎn)生____個內(nèi)存訪問操作。
A.1
B.2
C.3
D.4
6.全球500強超算在CPU、網(wǎng)絡(luò)等硬件上越來越體現(xiàn)出采用____的趨勢。
A.特殊硬件
B.通用硬件
C.非公開硬件
D.廉價硬件
7.并行算法設(shè)計所做的事情不包括____。
A.分解計算工作分配給多個處理器
B.保持?jǐn)?shù)據(jù)依賴保證結(jié)果正確
C.確保不能產(chǎn)生重復(fù)計算
D.盡量降低通信等額外開銷
8.CPU cache大小為32KB,64*64的兩個矩陣進(jìn)行加法計算,下面說法正確的是____。
A.可利用cache時間局部性優(yōu)化性能
B.可利用cache空間局部性優(yōu)化性能
C.可通過矩陣分片優(yōu)化性能
D.訪存方面無優(yōu)化可能
9.pthread_join的作用是____。
A.強制終止指定線程
B.檢測指定線程是否結(jié)束
C.等待指定線程結(jié)束才返回
D.向指定線程發(fā)送數(shù)據(jù)
10.使用____無法直接實現(xiàn)“主線程等待4個從線程完成任務(wù)”。
A.1個信號量
B.障礙
C.1個互斥量
D.4個互斥量
11.OpenMP并行模型是一種____編程模型。
A.靜態(tài)線程
B.動態(tài)線程
C.混合線程
D.眾核
12.關(guān)于MPI_recv對消息的區(qū)分,下列說法正確的是____。
A.只能使用消息標(biāo)簽
B.可以使用MPI_ANY_TAG
C.可以使用消息名
D.可以使用端口號
13.推動GPU應(yīng)用于通用高性能計算爆發(fā)式增長的開發(fā)工具是____。
A.OpenGL
B.OpenCL
C.DirectX
D.CUDA
14.OpenMP是___的一個常見替代。
A.SSE
B.MPI
C.Pthread
D.CUDA
15.一個AVX寄存器最多存放____個整型數(shù)。
A.2
B.4
C.8
D.16
16.一個Neon寄存器最多存放____個整型數(shù)。
A.2
B.4
C.8
D.16
17.每個AVX寄存器寬度為____位。
A.64
B.128
C.256
D.512
18.以下____是MPI基本原語。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
19.天河1號、天河2號、神威.太湖之光總體上都是____架構(gòu)
A.單核
B.多核
C.眾核
D.集群
20.編寫矩陣乘法的Neon程序,若矩陣元素為單精度浮點數(shù),則應(yīng)對矩陣乘—加計算的循環(huán)進(jìn)行____路循環(huán)展開。
A.2
B.4
C.8
D.16
21.執(zhí)行pthread_rwlock_rdlock時,____的情況下加鎖成功。
A.已有一個線程上了寫鎖
B.已有多個線程上了寫鎖
C.已有多個線程上了讀鎖
D.已有多個線程上了讀鎖和寫鎖
22.AVX是____平臺的SIMD架構(gòu)。
A.x86
B.POWER
C.SPARC
D.ARM
23.和一對多廣播對應(yīng)的組通信操作是____。
A.多對一收集
B.多對多收集
C.多對一歸約
D.多對多歸約
24.兩個n*n的矩陣相乘,將所有n^2個乘法計算劃分給不同進(jìn)程,再將對應(yīng)某行某列的n個乘法結(jié)果累加得到結(jié)果矩陣對應(yīng)元素,這是一種劃分____的數(shù)據(jù)并行。
A.輸入數(shù)據(jù)
B.中間結(jié)果
C.輸出數(shù)據(jù)
D.臨時數(shù)據(jù)
25.為防止編譯器不支持OpenMP,應(yīng)使用____實現(xiàn)OpenMP代碼和普通代碼的條件編譯。
A."#include "
B."#pragma omp parallel"
C."#ifdef _OPENMP"
D."#define _OPENMP"
26.對矩陣每行排序的程序進(jìn)行多線程并行化,對矩陣采用____。
A.簡單均勻塊劃分即可保證負(fù)載均衡
B.循環(huán)劃分才能實現(xiàn)負(fù)載均衡
C.動態(tài)劃分才能實現(xiàn)負(fù)載均衡
D.隨機劃分才能實現(xiàn)負(fù)載均衡
27.加速比計算中串行時間應(yīng)該取求解同一問題的哪個串行算法的時間____。
A.任意一個串行算法
B.作為并行算法基礎(chǔ)的那個串行算法
C.已知最優(yōu)的串行算法
D.所有串行算法的平均時間
28.當(dāng)處理器數(shù)量不變時,隨著問題規(guī)模增大,效率增大對____成立。
A.部分并行算法
B.所有并行算法
C.所有并行算法都不
D.以上皆錯
29.使用一個信號量實現(xiàn)“主線程等待4個從線程完成任務(wù)”,信號量初始值應(yīng)設(shè)置為____。
A.0
B.1
C.2
D.4
30.OpenMP循環(huán)劃分策略不包括____。
A.static
B.fixed
C.dynamic
D.guided
31.矩陣乘法問題更適合使用MPI的____編程模型。
A.阻塞的
B.非阻塞的
C.對等的
D.主從的
32.將寄存器設(shè)置為4個給定單精度浮點數(shù)的SSE intrinsics指令是____。
A._mm_set_ps
B._mm_set1_ss
C._mm_setzero_ss
D._mm_setzero_ps
33.控制流語句進(jìn)行SIMD并行化很困難的原因是控制流語句導(dǎo)致____。
A.連續(xù)數(shù)據(jù)執(zhí)行不同指令
B.連續(xù)數(shù)據(jù)執(zhí)行相同指令
C.同一數(shù)據(jù)執(zhí)行不同指令
D.同一數(shù)據(jù)執(zhí)行相同指令
34.n個節(jié)點的超立方構(gòu)造成本為____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
35.MMX有____個專用寄存器。
A.4
B.8
C.16
D.32
36.pthread_rwlock_rdlock是對讀寫鎖進(jìn)行____操作。
A.加鎖
B.解鎖
C.加讀瑣
D.加寫鎖
37.對下面程序,說法正確的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }
A.破壞了數(shù)據(jù)依賴
B.未破壞數(shù)據(jù)依賴
C.取決于變量聲明
D.比臨界區(qū)方式性能差
38.以下說法正確的是____。
A.多對多廣播的高效算法基于一對多廣播的高效算法
B.多對多歸約的高效算法基于多對一歸約的高效算法
C.多對多廣播的高效算法基于串行的一對多廣播算法
D.以上皆錯
39.為了實現(xiàn)向量計算,SIMD架構(gòu)還需提供____。
A.更大的內(nèi)存容量
B.更快的內(nèi)存?zhèn)鬏?/p>
C.更寬的寄存器
D.更快的網(wǎng)絡(luò)傳輸
40.Pthread不支持____。
A.創(chuàng)建并發(fā)執(zhí)行線程
B.同步
C.非顯式通信
D.自動并行化
41.一個AVX寄存器最多存放____個單精度浮點數(shù)。
A.2
B.4
C.8
D.16
42.SSE intrinsics _mm_storeu_pd命令的功能是____。
A.對齊標(biāo)量存單精度浮點數(shù)
B.未對齊標(biāo)量存單精度浮點數(shù)
C.對齊向量存雙精度浮點數(shù)
D.未對齊向量存雙精度浮點數(shù)
43.一個Neon寄存器最多存放____個單精度浮點數(shù)。
A.2
B.4
C.8
D.16
44.在用pthread_mutex_lock對互斥量進(jìn)行加鎖時,若其已上鎖,則線程進(jìn)入____狀態(tài)。
A.初始化
B.阻塞
C.繼續(xù)執(zhí)行
D.銷毀
45.對單精度浮點計算,SSE最高實現(xiàn)____路并行。
A.2
B.4
C.8
D.16
46.SSE intrinsics _mm_hadd_ps命令的功能是____。
A.寄存器間單精度浮點數(shù)向量加法
B.寄存器間雙精度浮點數(shù)向量加法
C.寄存器內(nèi)單精度浮點數(shù)加法
D.寄存器內(nèi)雙精度浮點數(shù)加法
47.有大量分支指令的程序不適合下面哪種體系結(jié)構(gòu)上進(jìn)行并行化?
A.SISD
B.SIMD
C.SPMD
D.MIMD
48.對于加速比S和處理器數(shù)量p,下列說法正確的是____。
A.有可能S>p
B.必然S<p
C.不可能S=p
D.兩者無關(guān)聯(lián)
49.在編寫使用n個線程進(jìn)行n個數(shù)求和的OpenMP的程序時采用臨界區(qū)技術(shù),則多線程版本____串行版本。
A.肯定快于
B.肯定慢于
C.可能快于
D.以上皆錯
50.兩個矩陣相乘,若矩陣總規(guī)模小于cache大小,則優(yōu)化訪存的最佳方法是____。
A.先將兩個矩陣讀入cache再進(jìn)行乘法
B.先轉(zhuǎn)置第一個矩陣再進(jìn)行乘法
C.先轉(zhuǎn)置第二個矩陣再進(jìn)行乘法
D.以上皆錯
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學(xué)習(xí)
詳情請咨詢QQ : 3230981406或微信:aopopenfd777