推荐一个比较好玩的3Dpose检测器,使用Unity编写,使用的模型格式为.onnx,在1060显卡上可以实时进行检测,可以输入视频图像或者采用webcam。也可以更换avatar模型哦。
Python 官方文档终于发布中文版了!受英语困扰的小伙伴终于可以更轻松地阅读官方文档了。 官方文档是python最权威最完备的文档,很多python的使用方法没有比官网更全面的,当然,民间有一些python的中文教程,但是汉化水平各异。 现在python的中文版终于来了,这是最官方最严谨的中文python文档,觉得看英文不舒服的小伙伴们可以直接点开中文进行查看。
吴恩达想必不用多说了,入门深度学习的启蒙老师,有多少人是看吴恩达的课进入深度学习领域的~虽然吴恩达的课实践稍微少一些(这是大家对吴恩达老师最初的印象,但其实他现在已经变了),但是理论知识讲的非常的详细,最近在 3 月 21 日,吴恩达开设的斯坦福深度学习课程 CS230 课程视频发布到了网上。
但是眼下由英伟达的研究人员Taesung Park、Ming-Yu Liu、Ting-Chun Wang和Jun-Yan Zhu(朱俊彦)共同完成的新的可生成图像的GAN:GauGAN。 正式介绍一下英伟达出品的GauGAN:我们画一幅涂鸦,用颜色区分每一块对应着什么物体,它就能照着我们的空间布局思路,合成以假乱真的真实世界效果图。
看来今年真的是嵌入式AI的元年呀,不仅谷歌之前发布了千元级TPU芯片,现在英伟达也不甘落后发布了最新的嵌入式计算套件。 也就这两天,2019年GTC大会,老黄发布了Jetson Nano这个体积较小但是性能不弱的小型AI计算机。
这是一个基于CNN的人脸检测的开源库,CNN模型权重信息已在C源文件中转换为stastic variales。也就是说我们需要的模型权重不再是某个特定格式的文件,而直接是.cpp。面部识别源代码不依赖于任何其他库。因此在速度上还是精度上,都有巨大的优势,是目前已知开源库中最好用的一款。
几天前Google一年一度的TensorFlow开发者大会在加州举行,最大的看点是新的消费级TPU开发板和TensorFlow0-2.0的出现。 这里我就不多说TensorFlow-2.0有多好好云云,比较关注的是谷歌新推出的TPU开发板Coral。 Coral是什么,它是是一款售价150美元(折合人民币约1000元)的开发板(Coral Dev Board),类似于树莓派,相当于一个小型计算机了,具有可拆卸的模块化系统和一个定制的TPU芯片。
GAN真的很好玩,各种各样的有趣玩具,这个给老照片上色也是一段时间前的应用了,项目名称为Deoldify,但是因为数据集的缘故效果偶尔有些差强人意。最近另一个团队采取之前项目的团队的思路,但是又整理了一批新的数据集,共有500,000幅图像供于训练。
风格迁移一般分两种,一种为艺术风格迁移(artistic style transfer),也就是上述使用Pytorch实现的Neural Transfer吗,这种风格迁移最终形成的是一副充满艺术气息的画作。而第二种则为真实风格迁移(photorealistic style transfer)。真实风格迁移最终形成输出的图像和输入图像相同,皆为真实图像,从而可以以假乱真。
一图胜千言,无论我们开始学习怎样的数学公式,使用图形来表示比枯燥的文字表现不知道先进了多少倍。今天偶然发现一个交互式学习线性代数的在线电子书,叫做《沉浸式线性代数》(Immersive Linear Algebra) 。介绍线性代数的一些基础知识,内容全是干货,非常值的学习。
这个模型最大的特点就是在卷积中可以一直保持高分辨率特征,不和我们之前使用的一些其他模型从低特征转化为高特征,而是从始至终保持高分辨率特征。这也是为什么这个模型,可以在COCO数据集的关键点检测、姿态估计、多人姿态估计这三项任务里,HRNet模型都超越了所有前辈。
AdaBound就是一个结合了SGD和Adam两种优化算法的一种新型的算法,在训练开始阶段,它能像Adam一样快速,在后期又能像SGD一样有很好的收敛性
虽然这项技术是比较新奇比较好玩的,实现起来只有硬件设备达到要求,在任何电脑上都是可以运行的。 但是我们应该将次技术用于对社会有利的地方,而不是用于一些非法牟利或者造成对其他人的肖像权进行侵害。
TensorFlow开源了一个可以实时人物分割模型——BodyPix。这个模型在浏览器上使用TensorFlow.js框架就能跑。在i5-7500笔记本处理器下跑,可达每秒24帧。用iPhone X跑,每秒21帧。
该论文实现的结果可以任意地修改脸部的信息,同时生成高质量的合成信息。利用 SC-FEGAN 网络可以识别人类手动添加的线条和颜色,利用SN-patchGAN鉴别器和带有门控卷积层的类似于Unet的生成器去生成以假乱真的图像。
利用StyleGAN和3D Face Reconstruction结合可以生成独一无二的3D头像。 StyleGAN是什么呢,是前些日子英伟达的最强人脸GAN,它可以随机生成一些独一无二的人脸图像,整个世界也找不到一样的哦(如果雷同纯属巧合)。
通过单眼照相机采集的RGB视频,学习人手的运动和交互对象之间的相互作用的因果关系,提出了一种生成模型,可以被用来重建的各种多步相互作用。 该提出的方法用于编码的交互,对象包含在动作时,对象的状态,并且创建一个动作情节描述他们的因果关系,使用动作情节,回归神经网络(RNN )训练模型。
在这里,我们展示了一个以滑动方式计算盒滤波器响应的卷积层,这个卷积层可以在深度架构中使用,而在这种层中,滑动框的尺寸和偏移量可以作为端到端损失最小化的一部分来学习