当前位置:首页 > 计算机网络 > 程序设计 > OpenCL异构计算章节试读
出版社:清华大学出版社
出版日期:2012-6
ISBN:9787302286851
作者:Benedict R. Gaster,Lee Howes,David R. Kaeli,Perhaad Mistry,Dana Schaa
页数:271页
《OpenCL异构计算》的笔记-第109页
barrier与marker:enqueueMarker(插入同步标记?),还有一个waitForEvents
《OpenCL异构计算》的笔记-第37页
clSetKernelArg:将主机端的输入/输出buffer与设备端kernel关联。
这个API的命名不够好
《OpenCL异构计算》的笔记-第112页
OpenCL内存模型一个非常关键的地方:操作没有完成之前,对内存的修改是不可见的
《OpenCL异构计算》的笔记-第116页
内存写入操作在kernel内部不保证可见,除非遇到fence操作
《OpenCL异构计算》的笔记-第82页
clSetKernelArg其实就是从主机端向设备端的kernel函数传递输入/输出参数——这个API还是好理解的
sampler是描述如何访问image的对象。规定了坐标系类型和访问越界时的处理方法
《OpenCL异构计算》的笔记-第53页
AMD Radeon HD 6970:wave调度器???
《OpenCL异构计算》的笔记-第75页
。。。图像旋转是一个非常容易并行的问题
《OpenCL异构计算》的笔记-第56页
ATOM不支持乱序执行从而影响了单线程性能,但支持某种形式的分时多线程
《OpenCL异构计算》的笔记-第60页
Sun/Oracle的Niagara:没有复杂的乱序执行电路,用大量线程的设计来提高IO吞吐量
《OpenCL异构计算》的笔记-第48页
SIMD:x86的SSE和AVX,PPC的AltiVec,ARM的Neon
《OpenCL异构计算》的笔记-第108页
native kernel??允许GPU调用CPU吗
《OpenCL异构计算》的笔记-第31页
__global、__local这类数据存储类型标注让我想起了C语言一开始时的register,这些本应该是可以用编译器优化消除掉的
《OpenCL异构计算》的笔记-第75页
OpenCL 1.1的主机端C++封装??
《OpenCL异构计算》的笔记-第62页
HD6xxx:宽度为5的VLIW,只有第5个可以执行特殊指令(如sin,cos)
《OpenCL异构计算》的笔记-第26页
Program对象,——这个应该是继承了GLSL
《OpenCL异构计算》的笔记-第28页
kernel:这里有些不太清楚,一个显卡是不是对应一个kernel??
《OpenCL异构计算》的笔记-第23页
命令队列的概念在WDF里似乎有类似的描述,这应该是为了对设备的异步IO操作设计的?
《OpenCL异构计算》的笔记-第104页
允许事件回调:clSetEventCallback
《OpenCL异构计算》的笔记-第98页
cl_event:用事件在队列之间同步?
《OpenCL异构计算》的笔记-第46页
指令流缺乏内在并行性,VLIW不会比乱序执行更糟糕
《OpenCL异构计算》的笔记-第83页
这里的卷积kernel函数使用了3个存储类型标注:__read_only,__write_only,__constant
《OpenCL异构计算》的笔记-第113页
sub-buffer的概念似乎正好对应于GLSL Shader里将顶点坐标、颜色等数据打包到一个buffer的做法,对于OpenCL来说,会造成别名问题