22春學(xué)期(高起本1709-1803、全層次1809-2103)《并行程序設(shè)計》在線作業(yè)【資料答案】

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2022-08-27 19:21:26來源:admin瀏覽: 53 次

22春學(xué)期(高起本1709-1803、全層次1809-2103)《并行程序設(shè)計》在線作業(yè)-00002

試卷總分:100  得分:100

一、單選題 (共 50 道試題,共 100 分)

1.對單精度浮點計算,MMX最高實現(xiàn)____路并行。

A.2

B.4

C.8

D.16


2.從線程檢查主線程是否要求它退出應(yīng)采用____。

A.pthread_join

B.pthread_cancel

C.pthread_testcancel

D.pthread_exit


3.條件變量相對于互斥量的優(yōu)點是____。

A.是多源狀態(tài)

B.加鎖解鎖開銷低

C.條件不成立時阻塞線程并自動解鎖加鎖

D.以上皆錯


4.編寫矩陣乘法的SSE程序,若矩陣元素為單精度浮點數(shù),則應(yīng)對矩陣乘—加計算的循環(huán)進(jìn)行____路循環(huán)展開。

A.2

B.4

C.8

D.16


5.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系統(tǒng)向量化訪存是按16字節(jié)對齊的,則此向量化程序每個循環(huán)步產(chǎn)生____個內(nèi)存訪問操作。

A.1

B.2

C.3

D.4


6.全球500強超算在CPU、網(wǎng)絡(luò)等硬件上越來越體現(xiàn)出采用____的趨勢。

A.特殊硬件

B.通用硬件

C.非公開硬件

D.廉價硬件


7.并行算法設(shè)計所做的事情不包括____。

A.分解計算工作分配給多個處理器

B.保持?jǐn)?shù)據(jù)依賴保證結(jié)果正確

C.確保不能產(chǎn)生重復(fù)計算

D.盡量降低通信等額外開銷


8.CPU cache大小為32KB,64*64的兩個矩陣進(jìn)行加法計算,下面說法正確的是____。

A.可利用cache時間局部性優(yōu)化性能

B.可利用cache空間局部性優(yōu)化性能

C.可通過矩陣分片優(yōu)化性能

D.訪存方面無優(yōu)化可能


9.pthread_join的作用是____。

A.強制終止指定線程

B.檢測指定線程是否結(jié)束

C.等待指定線程結(jié)束才返回

D.向指定線程發(fā)送數(shù)據(jù)


10.使用____無法直接實現(xiàn)“主線程等待4個從線程完成任務(wù)”。

A.1個信號量

B.障礙

C.1個互斥量

D.4個互斥量


11.OpenMP并行模型是一種____編程模型。

A.靜態(tài)線程

B.動態(tài)線程

C.混合線程

D.眾核


12.關(guān)于MPI_recv對消息的區(qū)分,下列說法正確的是____。

A.只能使用消息標(biāo)簽

B.可以使用MPI_ANY_TAG

C.可以使用消息名

D.可以使用端口號


13.推動GPU應(yīng)用于通用高性能計算爆發(fā)式增長的開發(fā)工具是____。

A.OpenGL

B.OpenCL

C.DirectX

D.CUDA


14.OpenMP是___的一個常見替代。

A.SSE

B.MPI

C.Pthread

D.CUDA


15.一個AVX寄存器最多存放____個整型數(shù)。

A.2

B.4

C.8

D.16


16.一個Neon寄存器最多存放____個整型數(shù)。

A.2

B.4

C.8

D.16


17.每個AVX寄存器寬度為____位。

A.64

B.128

C.256

D.512


18.以下____是MPI基本原語。

A.MPI_barrier

B.MPI_Comm_numprocs

C.MPI_Comm_rank

D.MPI_Comm_Send


19.天河1號、天河2號、神威.太湖之光總體上都是____架構(gòu)

A.單核

B.多核

C.眾核

D.集群


20.編寫矩陣乘法的Neon程序,若矩陣元素為單精度浮點數(shù),則應(yīng)對矩陣乘—加計算的循環(huán)進(jìn)行____路循環(huán)展開。

A.2

B.4

C.8

D.16


21.執(zhí)行pthread_rwlock_rdlock時,____的情況下加鎖成功。

A.已有一個線程上了寫鎖

B.已有多個線程上了寫鎖

C.已有多個線程上了讀鎖

D.已有多個線程上了讀鎖和寫鎖


22.AVX是____平臺的SIMD架構(gòu)。

A.x86

B.POWER

C.SPARC

D.ARM


23.和一對多廣播對應(yīng)的組通信操作是____。

A.多對一收集

B.多對多收集

C.多對一歸約

D.多對多歸約


24.兩個n*n的矩陣相乘,將所有n^2個乘法計算劃分給不同進(jìn)程,再將對應(yīng)某行某列的n個乘法結(jié)果累加得到結(jié)果矩陣對應(yīng)元素,這是一種劃分____的數(shù)據(jù)并行。

A.輸入數(shù)據(jù)

B.中間結(jié)果

C.輸出數(shù)據(jù)

D.臨時數(shù)據(jù)


25.為防止編譯器不支持OpenMP,應(yīng)使用____實現(xiàn)OpenMP代碼和普通代碼的條件編譯。

A."#include "

B."#pragma omp parallel"

C."#ifdef _OPENMP"

D."#define _OPENMP"


26.對矩陣每行排序的程序進(jìn)行多線程并行化,對矩陣采用____。

A.簡單均勻塊劃分即可保證負(fù)載均衡

B.循環(huán)劃分才能實現(xiàn)負(fù)載均衡

C.動態(tài)劃分才能實現(xiàn)負(fù)載均衡

D.隨機劃分才能實現(xiàn)負(fù)載均衡


27.加速比計算中串行時間應(yīng)該取求解同一問題的哪個串行算法的時間____。

A.任意一個串行算法

B.作為并行算法基礎(chǔ)的那個串行算法

C.已知最優(yōu)的串行算法

D.所有串行算法的平均時間


28.當(dāng)處理器數(shù)量不變時,隨著問題規(guī)模增大,效率增大對____成立。

A.部分并行算法

B.所有并行算法

C.所有并行算法都不

D.以上皆錯


29.使用一個信號量實現(xiàn)“主線程等待4個從線程完成任務(wù)”,信號量初始值應(yīng)設(shè)置為____。

A.0

B.1

C.2

D.4


30.OpenMP循環(huán)劃分策略不包括____。

A.static

B.fixed

C.dynamic

D.guided


31.矩陣乘法問題更適合使用MPI的____編程模型。

A.阻塞的

B.非阻塞的

C.對等的

D.主從的


32.將寄存器設(shè)置為4個給定單精度浮點數(shù)的SSE intrinsics指令是____。

A._mm_set_ps

B._mm_set1_ss

C._mm_setzero_ss

D._mm_setzero_ps


33.控制流語句進(jìn)行SIMD并行化很困難的原因是控制流語句導(dǎo)致____。

A.連續(xù)數(shù)據(jù)執(zhí)行不同指令

B.連續(xù)數(shù)據(jù)執(zhí)行相同指令

C.同一數(shù)據(jù)執(zhí)行不同指令

D.同一數(shù)據(jù)執(zhí)行相同指令


34.n個節(jié)點的超立方構(gòu)造成本為____。

A.O(logn)

B.O(sqrt(n))

C.O(n)

D.O(nlogn)


35.MMX有____個專用寄存器。

A.4

B.8

C.16

D.32


36.pthread_rwlock_rdlock是對讀寫鎖進(jìn)行____操作。

A.加鎖

B.解鎖

C.加讀瑣

D.加寫鎖


37.對下面程序,說法正確的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }

A.破壞了數(shù)據(jù)依賴

B.未破壞數(shù)據(jù)依賴

C.取決于變量聲明

D.比臨界區(qū)方式性能差


38.以下說法正確的是____。

A.多對多廣播的高效算法基于一對多廣播的高效算法

B.多對多歸約的高效算法基于多對一歸約的高效算法

C.多對多廣播的高效算法基于串行的一對多廣播算法

D.以上皆錯


39.為了實現(xiàn)向量計算,SIMD架構(gòu)還需提供____。

A.更大的內(nèi)存容量

B.更快的內(nèi)存?zhèn)鬏?/p>

C.更寬的寄存器

D.更快的網(wǎng)絡(luò)傳輸


40.Pthread不支持____。

A.創(chuàng)建并發(fā)執(zhí)行線程

B.同步

C.非顯式通信

D.自動并行化


41.一個AVX寄存器最多存放____個單精度浮點數(shù)。

A.2

B.4

C.8

D.16


42.SSE intrinsics _mm_storeu_pd命令的功能是____。

A.對齊標(biāo)量存單精度浮點數(shù)

B.未對齊標(biāo)量存單精度浮點數(shù)

C.對齊向量存雙精度浮點數(shù)

D.未對齊向量存雙精度浮點數(shù)


43.一個Neon寄存器最多存放____個單精度浮點數(shù)。

A.2

B.4

C.8

D.16


44.在用pthread_mutex_lock對互斥量進(jìn)行加鎖時,若其已上鎖,則線程進(jìn)入____狀態(tài)。

A.初始化

B.阻塞

C.繼續(xù)執(zhí)行

D.銷毀


45.對單精度浮點計算,SSE最高實現(xiàn)____路并行。

A.2

B.4

C.8

D.16


46.SSE intrinsics _mm_hadd_ps命令的功能是____。

A.寄存器間單精度浮點數(shù)向量加法

B.寄存器間雙精度浮點數(shù)向量加法

C.寄存器內(nèi)單精度浮點數(shù)加法

D.寄存器內(nèi)雙精度浮點數(shù)加法


47.有大量分支指令的程序不適合下面哪種體系結(jié)構(gòu)上進(jìn)行并行化?

A.SISD

B.SIMD

C.SPMD

D.MIMD


48.對于加速比S和處理器數(shù)量p,下列說法正確的是____。

A.有可能S>p

B.必然S<p

C.不可能S=p

D.兩者無關(guān)聯(lián)


49.在編寫使用n個線程進(jìn)行n個數(shù)求和的OpenMP的程序時采用臨界區(qū)技術(shù),則多線程版本____串行版本。

A.肯定快于

B.肯定慢于

C.可能快于

D.以上皆錯


50.兩個矩陣相乘,若矩陣總規(guī)模小于cache大小,則優(yōu)化訪存的最佳方法是____。

A.先將兩個矩陣讀入cache再進(jìn)行乘法

B.先轉(zhuǎn)置第一個矩陣再進(jìn)行乘法

C.先轉(zhuǎn)置第二個矩陣再進(jìn)行乘法

D.以上皆錯



奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學(xué)習(xí)
詳情請咨詢QQ : 3230981406或微信:aopopenfd777


作業(yè)咨詢 論文咨詢
微信客服掃一掃

回到頂部