深度好玩新闻 - Oldpan的个人博客

好玩的3D姿态检测！

2020/06/13

推荐一个比较好玩的3Dpose检测器，使用Unity编写，使用的模型格式为.onnx，在1060显卡上可以实时进行检测，可以输入视频图像或者采用webcam。也可以更换avatar模型哦。

Python的中文文档

2019/04/10

Python 官方文档终于发布中文版了！受英语困扰的小伙伴终于可以更轻松地阅读官方文档了。官方文档是python最权威最完备的文档，很多python的使用方法没有比官网更全面的，当然，民间有一些python的中文教程，但是汉化水平各异。现在python的中文版终于来了，这是最官方最严谨的中文python文档，觉得看英文不舒服的小伙伴们可以直接点开中文进行查看。

斯坦福最新机器学习视频发布~

2019/04/03

吴恩达想必不用多说了，入门深度学习的启蒙老师，有多少人是看吴恩达的课进入深度学习领域的~虽然吴恩达的课实践稍微少一些(这是大家对吴恩达老师最初的印象，但其实他现在已经变了)，但是理论知识讲的非常的详细，最近在 3 月 21 日，吴恩达开设的斯坦福深度学习课程 CS230 课程视频发布到了网上。

随手涂鸦摇身一变成为名画

2019/03/21

但是眼下由英伟达的研究人员Taesung Park、Ming-Yu Liu、Ting-Chun Wang和Jun-Yan Zhu（朱俊彦）共同完成的新的可生成图像的GAN:GauGAN。正式介绍一下英伟达出品的GauGAN：我们画一幅涂鸦，用颜色区分每一块对应着什么物体，它就能照着我们的空间布局思路，合成以假乱真的真实世界效果图。

又一个边缘计算设备

2019/03/19

看来今年真的是嵌入式AI的元年呀，不仅谷歌之前发布了千元级TPU芯片，现在英伟达也不甘落后发布了最新的嵌入式计算套件。也就这两天，2019年GTC大会，老黄发布了Jetson Nano这个体积较小但是性能不弱的小型AI计算机。

可在树莓派实时运行的人脸检测

2019/03/15

这是一个基于CNN的人脸检测的开源库，CNN模型权重信息已在C源文件中转换为stastic variales。也就是说我们需要的模型权重不再是某个特定格式的文件，而直接是.cpp。面部识别源代码不依赖于任何其他库。因此在速度上还是精度上，都有巨大的优势，是目前已知开源库中最好用的一款。

几天前Google一年一度的TensorFlow开发者大会在加州举行，最大的看点是新的消费级TPU开发板和TensorFlow0-2.0的出现。这里我就不多说TensorFlow-2.0有多好好云云，比较关注的是谷歌新推出的TPU开发板Coral。 Coral是什么，它是是一款售价150美元（折合人民币约1000元）的开发板（Coral Dev Board），类似于树莓派，相当于一个小型计算机了，具有可拆卸的模块化系统和一个定制的TPU芯片。

给老照片上色，让回忆变得更有色彩

2019/03/06

GAN真的很好玩，各种各样的有趣玩具，这个给老照片上色也是一段时间前的应用了，项目名称为Deoldify，但是因为数据集的缘故效果偶尔有些差强人意。最近另一个团队采取之前项目的团队的思路，但是又整理了一批新的数据集，共有500,000幅图像供于训练。

质量更好的快速风格迁移

2019/03/04

风格迁移一般分两种，一种为艺术风格迁移(artistic style transfer)，也就是上述使用Pytorch实现的Neural Transfer吗，这种风格迁移最终形成的是一副充满艺术气息的画作。而第二种则为真实风格迁移(photorealistic style transfer)。真实风格迁移最终形成输出的图像和输入图像相同，皆为真实图像，从而可以以假乱真。

可视化线性代数魔法书

2019/03/01

一图胜千言，无论我们开始学习怎样的数学公式，使用图形来表示比枯燥的文字表现不知道先进了多少倍。今天偶然发现一个交互式学习线性代数的在线电子书，叫做《沉浸式线性代数》(Immersive Linear Algebra) 。介绍线性代数的一些基础知识，内容全是干货，非常值的学习。

刷新纪录的姿态估计模型HRNet

2019/02/28

这个模型最大的特点就是在卷积中可以一直保持高分辨率特征，不和我们之前使用的一些其他模型从低特征转化为高特征，而是从始至终保持高分辨率特征。这也是为什么这个模型，可以在COCO数据集的关键点检测、姿态估计、多人姿态估计这三项任务里，HRNet模型都超越了所有前辈。

拳打Adam，脚踢SGD

2019/02/27

AdaBound就是一个结合了SGD和Adam两种优化算法的一种新型的算法，在训练开始阶段，它能像Adam一样快速，在后期又能像SGD一样有很好的收敛性

又一次深度换脸

2019/02/26

虽然这项技术是比较新奇比较好玩的，实现起来只有硬件设备达到要求，在任何电脑上都是可以运行的。但是我们应该将次技术用于对社会有利的地方，而不是用于一些非法牟利或者造成对其他人的肖像权进行侵害。

谷歌AR面部跟踪

2019/02/25

新版的ARcore不依赖其他的传感器，直接可以识别面部的追踪，最高多达468个识别点，无缝贴合3D人脸，最主要的是，在手机上就可以玩。

浏览器上实时运行的人物分割

2019/02/24

TensorFlow开源了一个可以实时人物分割模型——BodyPix。这个模型在浏览器上使用TensorFlow.js框架就能跑。在i5-7500笔记本处理器下跑，可达每秒24帧。用iPhone X跑，每秒21帧。

神经网络P图新神器，化妆美容一键搞定

2019/02/23

该论文实现的结果可以任意地修改脸部的信息，同时生成高质量的合成信息。利用 SC-FEGAN 网络可以识别人类手动添加的线条和颜色，利用SN-patchGAN鉴别器和带有门控卷积层的类似于Unet的生成器去生成以假乱真的图像。

如何生成独一无二的3D头像

2019/02/22

利用StyleGAN和3D Face Reconstruction结合可以生成独一无二的3D头像。 StyleGAN是什么呢，是前些日子英伟达的最强人脸GAN，它可以随机生成一些独一无二的人脸图像，整个世界也找不到一样的哦(如果雷同纯属巧合)。

可以识别人动作行为的生成模型

2019/02/21

通过单眼照相机采集的RGB视频，学习人手的运动和交互对象之间的相互作用的因果关系，提出了一种生成模型，可以被用来重建的各种多步相互作用。该提出的方法用于编码的交互，对象包含在动作时，对象的状态，并且创建一个动作情节描述他们的因果关系，使用动作情节，回归神经网络（RNN ）训练模型。

盒卷积？Box Convolution Layer for ConvNets

2019/02/20

在这里，我们展示了一个以滑动方式计算盒滤波器响应的卷积层，这个卷积层可以在深度架构中使用，而在这种层中，滑动框的尺寸和偏移量可以作为端到端损失最小化的一部分来学习