借着热点,简单聊聊大模型的部署方案,作为一个只搞过CV部署的算法工程师,在最近LLM逐渐改变生活的大背景下,猛然意识到LLM部署也是很重要的。大模型很火,而且确实有用(很多垂类场景…
你在看这个话题:TensorRT
一起实践量化番外篇——TensorRT-8的量化细节
好久不见各位~ 这篇文章很久之前写完一直没有整理,最近终于是整理差不多了,赶紧发出来。 本文接着《必看部署系列-神经网络量化教程:第一讲!》这一篇接着来说。上一篇主要说了量化的一些…
终于把TensorRT的engine模型的结构图画出来了!
终于把TensorRT的engine模型的结构图画出来了! 大概长这样(截取了最终模型图的输入部分),仔细看看: 可以看到很多层被融合了,比如conv1.weight + Quan…
AI部署系列:你知道模型权重的小秘密吗???
今天简单聊聊模型权重,也就是我们俗称的weight。 深度学习中,我们一直在训练模型,通过反向传播求导更新模型的权重,最终得到一个泛化能力比较强的模型。同样,如果我们不训练,仅仅随…
想要的都在这儿了!英伟达最新技术合集
不得不相信英伟达总能给我们惊喜,老潘作为一名深度学习从业者以及游戏爱好者,对于这种与AI、GPU、并行计算相关的话题一直都是比较感兴趣。作为深度学习第一大硬件平台的英伟达,我们自然…
逃不过呀!不论是训练还是部署都会让你踩坑的Batch Normalization
简单的Batch Normalization BN、Batch Normalization、批处理化层。 想必大家都不陌生。 BN是2015年论文Batch Normalizati…
老潘的AI部署以及工业落地学习之路
Hello我是老潘,好久不见各位。 最近在复盘今年上半年做的一些事情,不管是训练模型、部署模型搭建服务,还是写一些组件代码,零零散散是有一些产出。 虽然有了一点点成果,但仍觉着缺点…
TensorRT详细入门指北,如果你还不了解TensorRT,过来看看吧!
前言 大名鼎鼎的TensorRT有多牛逼就不多说了,因为确实很好用。 作为在英伟达自家GPU上的推理库,这些年来一直被大力推广,更新也非常频繁,issue反馈也挺及时…
想提速但TensorRT的FP16不得劲?怎么办?在线支招!
问题的开始 前些天尝试使用TensorRT转换一个模型,模型用TensorFlow训练,包含LSTM+Transform+CNN,是一个典型的时序结构模型,包含编码解码结构,暂称为…
实现TensorRT自定义插件(plugin)自由!
本系列为新TensorRT的第一篇,为什么叫新,因为之前已经写了两篇关于TensorRT的文章,是关于TensorRT-5.0版本的。好久没写关于TensorRT的文章了,所幸就以…
视觉算法的工业部署及落地方面的技术知识
最近看知乎上有一个童鞋这样提问: CV算法岗内卷现象的严重性先不多说。一看这个题目的关键字“部署”和“落地”。这两个关键字就深深吸引到了我 。想想当年(去年)秋招,神仙打架诸神黄昏…
利用TensorRT实现神经网络提速(读取ONNX模型并运行)
本文部分内容已经过时,不过仍有参考意义,截止2020.4.19. TRT已经出了7版本。 前言 这篇文章接着上一篇继续讲解如何具体使用TensorRT。 在之前已经写到过一篇去介绍…
利用TensorRT对深度学习进行加速
前言 TensorRT是什么,TensorRT是英伟达公司出品的高性能的推断C++库,专门应用于边缘设备的推断,TensorRT可以将我们训练好的模型分解再进行融合,融合后的模型具…