anchor-free目标检测属于anchor-free系列的目标检测,相比于CornerNet做出了改进,使得检测速度和精度相比于one-stage和two-stage的框架都有…
你在看这个话题:机器学习
机器学习系统或者SysML&DL笔记(一)
在使用过TVM、TensorRT等优秀的机器学习编译优化系统以及Pytorch、Keras等深度学习框架后,总觉得有必要从理论上对这些系统进行一些分析,虽然说在实践中学习是最快最直…
手撕非极大值抑制算法NMS与soft-NMS
前言 非极大值抑制算法(Non-maximum suppression, NMS)是有anchor系列目标检测的标配,如今大部分的One-Stage和Two-Stage算法在推断(…
图像、神经网络优化利器:了解Halide
前言 Halide是用C++作为宿主语言的一个图像处理相关的DSL(Domain Specified Language)语言,全称领域专用语言。主要的作用为在软硬层面上(与算法本身…
我们来谈谈ONNX的日常
前言 为什么要说ONNX,ONNX又是个什么东西,经常要部署神经网络应用的童鞋们可能会ONNX会比较熟悉,我们可能会在某一任务中将Pytorch或者TensorFlow模型转化为O…
一步一步解读神经网络编译器TVM(二)——利用TVM完成C++端的部署
前言 在上一篇文章中<一步一步解读神经网络编译器TVM(一)——一个简单的例子>,我们简单介绍了什么是TVM以及如何利用Relay IR去编译网络权重然后并运行起来。 …
人工智能家庭机器人gomer试玩
前言 少儿编程和青少年的人工智能教育已经是中国不可忽略的话题,如果将两个结合到一起那就是一个非常大的创业点。另外,人工智能也逐渐实现落地,将更多的人工智能算法部署到嵌入式端也是未来…
一步一步解读神经网络编译器TVM(一)——一个简单的例子
前言 这是一个TVM教程系列,计划从TVM的使用说明,再到TVM的内部源码,为大家大致解析一下TVM的基本工作原理。因为TVM的中文资料比较少,也希望贡献一下自己的力量,如有描述方…
Pytorch中多GPU训练指北
前言 在数据越来越多的时代,随着模型规模参数的增多,以及数据量的不断提升,使用多GPU去训练是不可避免的事情。Pytorch在0.4.0及以后的版本中已经提供了多GPU训练的方式,…
随身GPU服务器:Kaggle中kernels的快速入门指南
前言 对于很多入门深度学习领域的小伙伴来说啊,拥有一款合适的显卡是必要的,只有拥有好的装备才能更好更快地进行神经网络的训练、调试网络结构、改善我们的代码,进而更快地产出结果。 也就…
Pytorch的C++端(libtorch)在Windows中的使用
前言 填一个之前的坑啊,本篇的姊妹篇——利用Pytorch的C++前端(libtorch)读取预训练权重并进行预测 这篇文章中已经说明了如何在Ubuntu系统中使用libtorch…
利用TensorRT实现神经网络提速(读取ONNX模型并运行)
本文部分内容已经过时,不过仍有参考意义,截止2020.4.19. TRT已经出了7版本。 前言 这篇文章接着上一篇继续讲解如何具体使用TensorRT。 在之前已经写到过一篇去介绍…
Pytorch源码编译简明指南
前言 最近在浅尝Pytorch的源码,利用业余时间去品读品读,看着看着,第一次对Pytorch有了重新的认识。 原来现在Pytorch的版图是如此之大,Pytorch已经不是一年前…
解密Deepfake(深度换脸)-基于自编码器的(Pytorch代码)换脸技术
其实有关深度学习的换脸相关的研究已经很普及了,有基于`GAN`的也有基于`Glow`的,但本质上都是生成模型,只是换了一种实现方式,而这个DeepFake呢,使用的是机器学习中的*…
利用TensorRT对深度学习进行加速
前言 TensorRT是什么,TensorRT是英伟达公司出品的高性能的推断C++库,专门应用于边缘设备的推断,TensorRT可以将我们训练好的模型分解再进行融合,融合后的模型具…