本笔记为个人学习记录,仅供参考推荐学习连接:https://zhuanlan.zhihu.com/p/661182311https://zhuanlan.zhihu.com/p/662089556https://zhuanlan.zhihu.com/p/663093816Layout用来表述一个复杂的高维数据结构一个layout由两部分组成:shape 和 stride...
注: 本文内容部分来自GPT生成,实锤有效部署LXD的知识很多来自于yuanyu dalao,推荐各位有需要部署单机LXC/LXD的小伙伴参考他的文章~动机 & LXD集群好处很多实验室由于各种因素(没钱)的制约,很难给所有成员各自分配一台乃至多台服务器,导致共用服务器的需求产生。很不幸的是,每个人对环境的需求是千差万别的,有的人可能需要新版本的GCC,有的人可能需要...
要反向代理内网的网站,主要难点来自于caddy默认的HTTP-01证书获取模式是没法使用的(因为域名指向内网,而认证服务器显然没法访问内网地址),需要走DNS-01模式。本文主要以腾讯云(dnspod)为例,介绍如何将腾讯云dns模块编译进caddy中并完成认证过程。科学上网腾讯云dns模块在github上。总所周知,裸连github是个非常玄学的事情,强烈建议提前准备魔法上网并将htt...
本文主要记录如何在device代码内异步把数据从全局内存复制至shared内存,有关如何异步把数据从主机端拷贝到设备端,可以参考How to Overlap Data Transfers in CUDA C/C++ | NVIDIA Technical Blog本文主要内容来源于英伟达博客:Controlling Data Movement to Boost Performance on...
本文中所有的例程改编于CUB文档什么是CUB一个提供了一系列基于thread、warp、block、device等维度的便利函数的库,如:block级的基数排序(可以把一个block能访问到的数据都排好序)、warp级的读入函数(按照warp从核函数实参中的数组读入数据到thread的数组上)。以下为一个使用block级的基数排序的例子:123456789101112131415...
文章会议等级阅读情况Accelerating Multi-Scalar Multiplication for Efficient Zero Knowledge Proofs with Multi-GPU Systems2024ASPLOS 2024CCF-A[]GZKP: A GPU Accelerated Zero-Knowledge Proof Sys...
cmakehttps://subingwen.cn/cmake/CMake-primer/index.htmlconsteval与constexprhttps://tjsw.medium.com/潮-c-20-consteval-constexpr-的好兄弟-bfbcfdd4c763运算小寄巧虽然跟c++没啥关系,但懒得开新post了,就放这吧。向上取整到整数$x$的某个最近...
如果你擅长使用adb,请直接跳转到STEP5STEP1 下载ADB如果你电脑上有ADB可以跳过此步在google官网上下载adbhttps://dl.google.com/android/repository/platform-tools-latest-windows.zip?hl=zh-cn将其解压到你喜欢的位置即可,建议把解压出来的目录加到path里面方便powershell里...