如果出现格式错误请刷新本页

好玩的3D姿态检测!

2020/06/13

推荐一个比较好玩的3Dpose检测器,使用Unity编写,使用的模型格式为.onnx,在1060显卡上可以实时进行检测,可以输入视频图像或者采用webcam。也可以更换avatar模型哦。

Python的中文文档

2019/04/10

Python 官方文档终于发布中文版了!受英语困扰的小伙伴终于可以更轻松地阅读官方文档了。 官方文档是python最权威最完备的文档,很多python的使用方法没有比官网更全面的,当然,民间有一些python的中文教程,但是汉化水平各异。 现在python的中文版终于来了,这是最官方最严谨的中文python文档,觉得看英文不舒服的小伙伴们可以直接点开中文进行查看。

斯坦福最新机器学习视频发布~

2019/04/03

吴恩达想必不用多说了,入门深度学习的启蒙老师,有多少人是看吴恩达的课进入深度学习领域的~虽然吴恩达的课实践稍微少一些(这是大家对吴恩达老师最初的印象,但其实他现在已经变了),但是理论知识讲的非常的详细,最近在 3 月 21 日,吴恩达开设的斯坦福深度学习课程 CS230 课程视频发布到了网上。

随手涂鸦摇身一变成为名画

2019/03/21

但是眼下由英伟达的研究人员Taesung Park、Ming-Yu Liu、Ting-Chun Wang和Jun-Yan Zhu(朱俊彦)共同完成的新的可生成图像的GAN:GauGAN。 正式介绍一下英伟达出品的GauGAN:我们画一幅涂鸦,用颜色区分每一块对应着什么物体,它就能照着我们的空间布局思路,合成以假乱真的真实世界效果图。

又一个边缘计算设备

2019/03/19

看来今年真的是嵌入式AI的元年呀,不仅谷歌之前发布了千元级TPU芯片,现在英伟达也不甘落后发布了最新的嵌入式计算套件。 也就这两天,2019年GTC大会,老黄发布了Jetson Nano这个体积较小但是性能不弱的小型AI计算机。

可在树莓派实时运行的人脸检测

2019/03/15

这是一个基于CNN的人脸检测的开源库,CNN模型权重信息已在C源文件中转换为stastic variales。也就是说我们需要的模型权重不再是某个特定格式的文件,而直接是.cpp。面部识别源代码不依赖于任何其他库。因此在速度上还是精度上,都有巨大的优势,是目前已知开源库中最好用的一款。

谷歌千元消费级TPU发布

2019/03/10

几天前Google一年一度的TensorFlow开发者大会在加州举行,最大的看点是新的消费级TPU开发板和TensorFlow0-2.0的出现。 这里我就不多说TensorFlow-2.0有多好好云云,比较关注的是谷歌新推出的TPU开发板Coral。 Coral是什么,它是是一款售价150美元(折合人民币约1000元)的开发板(Coral Dev Board),类似于树莓派,相当于一个小型计算机了,具有可拆卸的模块化系统和一个定制的TPU芯片。

给老照片上色,让回忆变得更有色彩

2019/03/06

GAN真的很好玩,各种各样的有趣玩具,这个给老照片上色也是一段时间前的应用了,项目名称为Deoldify,但是因为数据集的缘故效果偶尔有些差强人意。最近另一个团队采取之前项目的团队的思路,但是又整理了一批新的数据集,共有500,000幅图像供于训练。

质量更好的快速风格迁移

2019/03/04

风格迁移一般分两种,一种为艺术风格迁移(artistic style transfer),也就是上述使用Pytorch实现的Neural Transfer吗,这种风格迁移最终形成的是一副充满艺术气息的画作。而第二种则为真实风格迁移(photorealistic style transfer)。真实风格迁移最终形成输出的图像和输入图像相同,皆为真实图像,从而可以以假乱真。

可视化线性代数魔法书

2019/03/01

一图胜千言,无论我们开始学习怎样的数学公式,使用图形来表示比枯燥的文字表现不知道先进了多少倍。今天偶然发现一个交互式学习线性代数的在线电子书,叫做《沉浸式线性代数》(Immersive Linear Algebra) 。介绍线性代数的一些基础知识,内容全是干货,非常值的学习。

刷新纪录的姿态估计模型HRNet

2019/02/28

这个模型最大的特点就是在卷积中可以一直保持高分辨率特征,不和我们之前使用的一些其他模型从低特征转化为高特征,而是从始至终保持高分辨率特征。这也是为什么这个模型,可以在COCO数据集的关键点检测、姿态估计、多人姿态估计这三项任务里,HRNet模型都超越了所有前辈。

拳打Adam,脚踢SGD

2019/02/27

AdaBound就是一个结合了SGD和Adam两种优化算法的一种新型的算法,在训练开始阶段,它能像Adam一样快速,在后期又能像SGD一样有很好的收敛性

又一次深度换脸

2019/02/26

虽然这项技术是比较新奇比较好玩的,实现起来只有硬件设备达到要求,在任何电脑上都是可以运行的。 但是我们应该将次技术用于对社会有利的地方,而不是用于一些非法牟利或者造成对其他人的肖像权进行侵害。

谷歌AR面部跟踪

2019/02/25

新版的ARcore不依赖其他的传感器,直接可以识别面部的追踪,最高多达468个识别点,无缝贴合3D人脸,最主要的是,在手机上就可以玩。

浏览器上实时运行的人物分割

2019/02/24

TensorFlow开源了一个可以实时人物分割模型——BodyPix。这个模型在浏览器上使用TensorFlow.js框架就能跑。在i5-7500笔记本处理器下跑,可达每秒24帧。用iPhone X跑,每秒21帧。

神经网络P图新神器,化妆美容一键搞定

2019/02/23

该论文实现的结果可以任意地修改脸部的信息,同时生成高质量的合成信息。利用  SC-FEGAN  网络可以识别人类手动添加的线条和颜色,利用SN-patchGAN鉴别器和带有门控卷积层的类似于Unet的生成器去生成以假乱真的图像。

如何生成独一无二的3D头像

2019/02/22

利用StyleGAN和3D Face Reconstruction结合可以生成独一无二的3D头像。 StyleGAN是什么呢,是前些日子英伟达的最强人脸GAN,它可以随机生成一些独一无二的人脸图像,整个世界也找不到一样的哦(如果雷同纯属巧合)。

可以识别人动作行为的生成模型

2019/02/21

通过单眼照相机采集的RGB视频,学习人手的运动和交互对象之间的相互作用的因果关系,提出了一种生成模型,可以被用来重建的各种多步相互作用。 该提出的方法用于编码的交互,对象包含在动作时,对象的状态,并且创建一个动作情节描述他们的因果关系,使用动作情节,回归神经网络(RNN )训练模型。

盒卷积?Box Convolution Layer for ConvNets

2019/02/20

在这里,我们展示了一个以滑动方式计算盒滤波器响应的卷积层,这个卷积层可以在深度架构中使用,而在这种层中,滑动框的尺寸和偏移量可以作为端到端损失最小化的一部分来学习