Welcome to Scribd!

21 Quiz 14.answer

Uploaded by

0% found this document useful (0 votes)

5 views1 page

This document contains two CUDA kernel functions: 1) A vector addition kernel that adds the elements of two input arrays A and B and stores the results in A. 2) Two solutions for a reverse array kernel that takes an input array, reverses the order of the elements within each block, and stores the results in an output array. The first solution uses thread offsets to directly write to the output array in reversed order. The second solution uses shared memory to first write the input elements in reversed order, synchronizes threads, and then writes from shared memory to the output array in forward order.

Original Description:

parallel

Original Title

21-Quiz-14.answer

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

5 views1 page

21 Quiz 14.answer

Uploaded by

demro channel

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

1 exercise 1

global void vector_addition(int A, int B, size_t n) {

A[threadIdx.x] += B[threadIdx.x];
}

2 Problem 2
question 1

global void reverseArrayBlock(int d_out, int d_in)

{
// compute the offset of the block
int inOffset = blockDim.x * blockIdx.x;
// compute the offset of the block after reversed
int outOffset = blockDim.x * (gridDim.x - 1 - blockIdx.x);
//compute the offset of a thread in the original block
int in = inOffset + threadIdx.x;
//compute the offset of a thread in the reversed block
int out = outOffset + (blockDim.x - 1 - threadIdx.x);
d_out[out] = d_in[in];
}

question 2

global void reverseArrayBlock(int d_out, int d_in)

{
//declare shared array s_data;
extern __shared__ int s_data[];
int inOffset = blockDim.x * blockIdx.x;
int in = inOffset + threadIdx.x;
// Load one element per thread from device memory and store it
// *in reversed order* into temporary shared memory
s_data[blockDim.x - 1 - threadIdx.x] = d_in[in];
// Block until all threads in the block have
// written their data to shared mem
__syncthreads();
// write the data from shared memory in forward order,
// but to the reversed block offset as before
int outOffset = blockDim.x * (gridDim.x - 1 - blockIdx.x);
int out = outOffset + threadIdx.x;
d_out[out] = s_data[threadIdx.x];
}

Class4 Advanced Cuda Opencl
Document64 pages
Class4 Advanced Cuda Opencl
Carlangaslangas
No ratings yet
Module 3 Quiz
Document2 pages
Module 3 Quiz
sy1990010111
No ratings yet
Gpu History and Cuda Programming Basics
Document44 pages
Gpu History and Cuda Programming Basics
Fransiskus Yoga Esa Wibowo
No ratings yet
Cuda
Document44 pages
Cuda
avinash kumar
No ratings yet
Class 10
Document13 pages
Class 10
Thiago Salles
No ratings yet
20 Quiz 14
Document12 pages
20 Quiz 14
demro channel
No ratings yet
Discussion Questions 5
Document2 pages
Discussion Questions 5
Sudip Adhikari
No ratings yet
Cuda Notes From Udacity Lecture
Document3 pages
Cuda Notes From Udacity Lecture
J G
No ratings yet
MUTEXSEM
Document2 pages
MUTEXSEM
Prashant Todkar
No ratings yet
Lock Rivers: Ted Baker Andy Wang CIS 4930 / COP 5641
Document48 pages
Lock Rivers: Ted Baker Andy Wang CIS 4930 / COP 5641
RajeshKumar
No ratings yet
GTHR Default
Document10 pages
GTHR Default
Paul
No ratings yet
Block Drivers: Sarah Diesburg COP 5641
Document40 pages
Block Drivers: Sarah Diesburg COP 5641
Mezbah
No ratings yet
Spark Internals RDD Cache
Document25 pages
Spark Internals RDD Cache
joseph lecoder
No ratings yet
Constructer & Destructer
Document12 pages
Constructer & Destructer
Amit Kumar
No ratings yet
CUDA
Document3 pages
CUDA
killua gojo
No ratings yet
Worst Fit Algorithm
Document12 pages
Worst Fit Algorithm
Magarsa Bedasa
No ratings yet
Algorithms and Data Structures
Document80 pages
Algorithms and Data Structures
程国强
No ratings yet
Program 4
Document25 pages
Program 4
api-709999921
No ratings yet
Misc C
Document3 pages
Misc C
Name
No ratings yet
Os Assignment 2 211000009
Document11 pages
Os Assignment 2 211000009
Alok Singh
No ratings yet
Kernel Cu
Document1 page
Kernel Cu
farhanhubble
100% (1)
Conv
Document4 pages
Conv
Hung Nguyen
No ratings yet
Inheritance Concept: Polygon
Document28 pages
Inheritance Concept: Polygon
Angshusmita Baruah Segra
No ratings yet
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
Document7 pages
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
Muhammad Azmat
No ratings yet
Rešenja Zadataka Za Treći Kolokvijum Iz Operativnih Sistema 1 Jun 2017
Document1 page
Rešenja Zadataka Za Treći Kolokvijum Iz Operativnih Sistema 1 Jun 2017
Tadija Radusinović
No ratings yet
Josh Cuda
Document27 pages
Josh Cuda
Ramu
No ratings yet
Java File
Document15 pages
Java File
Sunny Raj
No ratings yet
Dsa
Document7 pages
Dsa
hans peter
No ratings yet
Lecture 4
Document28 pages
Lecture 4
Diksha Seebaruth
No ratings yet
Lab7-Memory Management
Document6 pages
Lab7-Memory Management
Ashraf Gad
No ratings yet
Coursera Quiz Week1 Spring 2014 Heterogeneous Programming
Document4 pages
Coursera Quiz Week1 Spring 2014 Heterogeneous Programming
mrclueless
100% (5)
Module 3.1 - CUDA Parallelism Model: GPU Teaching Kit
Document44 pages
Module 3.1 - CUDA Parallelism Model: GPU Teaching Kit
yassin mechbal
No ratings yet
CUDA Programming: Johan Seland Johan - Seland@sintef - No
Document76 pages
CUDA Programming: Johan Seland Johan - Seland@sintef - No
Lilly Cheerotha
No ratings yet
Thread - RST
Document4 pages
Thread - RST
ermik69
No ratings yet
MCS-021 Data and File Structures
Document8 pages
MCS-021 Data and File Structures
kktamang09
No ratings yet
Java Program To Implement LinkedBlockingDeque API
Document6 pages
Java Program To Implement LinkedBlockingDeque API
discovrer
No ratings yet
ECE408 S19 ZJUI Exam1 Study Guide
Document25 pages
ECE408 S19 ZJUI Exam1 Study Guide
Haider ali
No ratings yet
Earth Motion Part 1 (Form Class)
Document3 pages
Earth Motion Part 1 (Form Class)
Abdul Ghaffar
No ratings yet
217 Lec2
Document24 pages
217 Lec2
palash
No ratings yet
CS 294-73 Software Engineering For Scientific Computing Lecture 13: Homework 3 Final Project
Document47 pages
CS 294-73 Software Engineering For Scientific Computing Lecture 13: Homework 3 Final Project
Edmund Zin
No ratings yet
Reza Aditya Data Structures
Document24 pages
Reza Aditya Data Structures
Ikbal Rullah
No ratings yet
Briland Hitaj Triangle Problem
Document5 pages
Briland Hitaj Triangle Problem
Briland Hitaj
No ratings yet
Operating System Assignment
Document5 pages
Operating System Assignment
Unknown
No ratings yet
(Sample Programs On:escape Sequences, Variables, Constants, Casting, Format Specifiers) 1
Document3 pages
(Sample Programs On:escape Sequences, Variables, Constants, Casting, Format Specifiers) 1
dinu
No ratings yet
LP 1,,1
Document5 pages
LP 1,,1
onkarbabhale69
No ratings yet
Lecture5 2
Document46 pages
Lecture5 2
raghunaath
No ratings yet
8786
Document14 pages
8786
fady fady
No ratings yet
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
Document8 pages
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
Hecttor Juarez
No ratings yet
Arid Agriculture University, Rawalpindi
Document15 pages
Arid Agriculture University, Rawalpindi
Umair Khan
No ratings yet
Slides 8
Document10 pages
Slides 8
Manish Choudhary Harnawa
No ratings yet
5 6314519115386063645
Document16 pages
5 6314519115386063645
Tharun Pattela
No ratings yet
Worst Fit
Document1 page
Worst Fit
41 Aanchal dayaramani
No ratings yet
HB - Games Test
Document4 pages
HB - Games Test
Marcelino López
No ratings yet
Ext2 File System Assignments and Description Lab
Document14 pages
Ext2 File System Assignments and Description Lab
yogeshwari bahiram
No ratings yet
Active Directory Windows Domain: It Even Overrides The "Block Inheritance" Setting
Document4 pages
Active Directory Windows Domain: It Even Overrides The "Block Inheritance" Setting
Gaurav Gupta
No ratings yet
Bad P 3
Document6 pages
Bad P 3
Zaki Erlangga
No ratings yet
Bad P OGL 0
Document6 pages
Bad P OGL 0
Lucas Nao
No ratings yet
Terminal
Document1 page
Terminal
يوتي يعين
No ratings yet
LPIC-1 Primer
From Everand
LPIC-1 Primer
John Greene
Rating: 4.5 out of 5 stars
4.5/5 (3)
ch 10 OB summary
Document7 pages
ch 10 OB summary
demro channel
No ratings yet
Lecture 3
Document27 pages
Lecture 3
demro channel
No ratings yet
lEC_10_Sorting _part1
Document162 pages
lEC_10_Sorting _part1
demro channel
No ratings yet
BUS1710 Chapter 2 Emotions
Document32 pages
BUS1710 Chapter 2 Emotions
demro channel
No ratings yet
Lecture 4
Document27 pages
Lecture 4
demro channel
No ratings yet
CSC423 - Lec10 - Distributed and Parallel ComputerSystems
Document29 pages
CSC423 - Lec10 - Distributed and Parallel ComputerSystems
demro channel
No ratings yet
CSC423 - Lec9 - Distributed and Parallel ComputerSystems
Document16 pages
CSC423 - Lec9 - Distributed and Parallel ComputerSystems
demro channel
No ratings yet
Parralel Demro 003
Document46 pages
Parralel Demro 003
demro channel
No ratings yet
CSC423 - Lec11 - Distributed and Parallel ComputerSystems
Document19 pages
CSC423 - Lec11 - Distributed and Parallel ComputerSystems
demro channel
No ratings yet
CSC423 - Lec7&8 - Distributed and Parallel ComputerSystems
Document3 pages
CSC423 - Lec7&8 - Distributed and Parallel ComputerSystems
demro channel
No ratings yet
LEC 4,5 Linked List
Document50 pages
LEC 4,5 Linked List
demro channel
No ratings yet
LEC - 2 Stack
Document20 pages
LEC - 2 Stack
demro channel
No ratings yet
Parralel 01
Document38 pages
Parralel 01
demro channel
No ratings yet
Sahyla
Document7 pages
Sahyla
demro channel
No ratings yet
LEC - 3 Queue
Document23 pages
LEC - 3 Queue
demro channel
No ratings yet
Exam 3 2015
Document2 pages
Exam 3 2015
demro channel
No ratings yet
Sahyla
Document3 pages
Sahyla
demro channel
No ratings yet
Chemistry Chapter One
Document16 pages
Chemistry Chapter One
demro channel
No ratings yet