深度学习的研究方向和发展趋势

news/2024/5/18 21:44:01 标签: 机器学习, 深度学习, 迁移学习, 强化学习, GAN

一. 人工智能应用领域

1. 计算机视觉

    生物特征识别:人脸识别、步态识别、行人ReID、瞳孔识别;

    图像处理:分类标注、以图搜图、场景分割、车辆车牌、OCR、AR;

    视频分析:安防监控、智慧城市;

2. 自然语言处理

    语音识别(Siri、Cortana、讯飞)、文本数据挖掘、文本翻译;

3. 数据挖掘

    消费习惯、天气数据、推荐系统、知识库(专家系统);

4. 游戏

    角色仿真、AlphaGo(强化学习);

5. 复合应用

    无人驾驶、无人机、机器人;

       天朝的 AI 趋势貌似势不可挡,华人的高智商开始凸显,看各大 Challenge 的获胜者,几乎清一色的华人的身影,包括 MSRA、FAIR、Google Brain 这几大研究机构,都有相当比例的华人科学家主导,让我看到了天朝崛起的希望。

       来看一张别人的统计图:

       

       在创业公司层面,目前国内也有很多 优秀的公司,领域的火热伴随着巨大的商机,你心动了么?


二. 需要具备的专业知识

1. 数学基础

      数学知识比较关键,这是作为你理解和学习算法原理的基础,列出比较关键的课程:

      高等数学(微积分)、线性代数、统计方法、矩阵论、概率论

          PS:图像相关童鞋 可以看一下《数字图像处理》

2. 编程基础

       两门编程语言是必须要掌握的,C++ 和 Python

3. 专业基础(算法和论文)

      基础教程:【UFLDL】【PRML】

      Deep Learning Paper:【Paper】

      Deep Learning Book:【Book】

      机器学习公开课:【网易】


三. 从学校制定的规划

       你有机会面临一开始的选择,可以成为该领域的专家,对自己的规划应该是:

Step 1. 为 PhD 努力

      这是必然的,你需要尽一切努力去得到一位学术大牛的指点,这至关重要,因为他能影响你的思维,做事情的方法,能够指点你技术的方向。

      这个阶段要确定自己的方向,不要过于发散。

Step 2. 抓住实习机会

      Google、FaceBook、MSRA 等大公司的实习机会也很关键(退而求其次选 BAT),这里有最专业的工程人才,要借助实习快速提升你的代码能力。

Step 3. 加入团队

      求志同道合者 建立业余团队,比如开源项目、研究方向课题组、ILSVRC竞赛 等;

      一方面可以 Follow 技术进展,另一方面通过 Challenge 提升自己解决实际问题的能力,不求获奖,重在参与;


四. 非专业人员转型

       之前有一篇 CSDN 的征文 - 你会为AI转型么?

       如果是我,我的答案会是,如果可以优雅的转身,那就转吧。

       如何保证优雅的转身?请到上面看你的基础知识能够 Match 多少?如果你的主要编程语言是 C++ 和 Python,并且数学功底很好,那么恭喜你,没什么障碍了,最多三个月的转型期,你马上就能成为一名合格的 AI 从业者。

       如果你大部分时间都在写 HTML and PHP,or再牛一点,精通 Java 的架构师,附带 大学数学挂过科,那么我给的建议是,没必要转型,了解 TensorFlow 的API就好了,想办法调用一下,该干嘛还是干嘛,继续领你架构师的高工资,AI的泡沫可不小,听哥的,别趟这趟浑水!

    > 转型开始

        开始转型,怎么一步一步的去实现这个目标呢?

        总结为4点: 看书、读论文、用框架、敲代码

1. 看书

    抓住工作之余的任何时间看书,每天坚持两个小时,最好把基础中提到的这些技术知识点都看完。

    恒心很重要,有恒心者有恒产,不管你信不信,我反正信了

2. 读论文

    读经典论文是最能提高你的技术逼格的方法,SSD、YOLO、LSTM、DQN 等等,每一个经典算法都是一次技术飞跃,读文章可以结合 Blog来看,当然也有很多翻译文章,所谓 “前人栽树,后人乘凉”,英文不太好的童鞋有福。

    Lucky,大多数的 Paper 都会附带实现代码,这是 共享的时代。

    PS:也是共享单车的时代,看到 OFO 集5个徽章得 77.77,真是醉了,连个数都是 支付宝的套路。

3. 用框架

    深度学习相关框架要多用,Pytorch,TensorFlow,Caffe,都是开源的,很多新的算法、文章都是基于这些框架实现的,必须熟悉。

4. 敲代码

    要理解的更深一些,或者加入自己的想法,定制自己专业领域的特殊问题,这就需要你在原来的基础上进行修改,修改是再创造的过程,不管是数据的重新训练,还是接口的不同调用方式,都是一种加深。

        除了 看书之外,其他三个 Item 是需要目标来驱动的,以解决项目中的实际问题为出发点,这是最好的入门方法。


五. 技术发展趋势

       前面也讲过,下一步的发展重点在 迁移学习强化学习、非监督学习 层面,对抗网络(GAN 也将会焕发新的光彩。

       而在应用领域,机器人将会在很大层度上推动深度学习的发展,也许在将来的5-10年,真的会诞生真正意义上的智能体,最近听说某某机器人通过了 图灵测试,很好奇,一看也只是在某个简单的层面。

       量子计算机、类脑、超脑 等大一批科技新星为之注入了强悍的体系支撑,全球在技术领域持续的资金和人才投入也将持续提供无限的动力,也许 AI目前是泡沫,但若是支撑到某个领域的突破,必然会带来新的生产力变革,换句话说,科技泡沫总归 比 房地产泡沫来得更实在一些。


http://www.niftyadmin.cn/n/904612.html

相关文章

Java多线程简介

Java多线程概览 java的多线程是个比较高级的主题。正在学习python的多线程,同步复习以下java多线程的基础知识吧。 介绍一些概念,细节另外再慢慢探究吧。 Java多线程机制 Java语言内置对多线程的支持,在大数据、分布式、高并发类的主题上应用…

基于视频的目标检测

一. 提出背景目标检测在图像处理领域有着非常大的占比,过去两年,深度学习在Detection的持续发力,为这个领域带来了变革式的发展:一方面,从 RCNN 到 Fast RCNN,再到 Faster RCNN,不断刷新 mAP&am…

DM8168的复位

7.2.1 系统级复位资源 DM8168有7种类型的系统级复位,表7-3列出了所有的复位类型:复位的发起者和每个复位的效果。 表7-3系统级复位类型 类型 发起者 复位除了仿真模块以外的所有模块 复位仿真模块 锁定BOOT脚 产生/RSTOUT信号 上电复位&#xff…

Faster R-CNN改进篇(二): RFCN ● RON

改进1:RFCN论文:R-FCN: Object Detection via Region-based Fully Convolutional Networks 【点击下载】MXNet代码:【Github】 一. 背景介绍RCNN 在目标检测上取得了很大的成功,比如 SPPnet、Fast R-CNN、Faster R-CNN 等&…

DM8168评估板上的复位及时钟电路的设计

复位电路 DM8168的复位管脚有:/RESET(PIN:G33),/POR(PIN:F37),/TRST(PIN:K36),/RSTOUT(PIN:G37&a…

PHP学习之分页类

<?php $page new Page(2, 40); var_dump($page->allUrl()); class Page {//每页显示多少条数据protected $number;//一共有多少条数据protected $totalCount;//当前页protected $page;//总页数protected $totalPage;//urlprotected $url;public function __construct($…

特征金字塔网络 FPN

一. 提出背景论文&#xff1a;Feature Pyramid Networks for Object Detection 【点击下载】在传统的图像处理方法中&#xff0c;金字塔是比较常用的一种手段&#xff0c;像 SIFT 基于金字塔做了多层的特征采集&#xff0c;对于深度网络来讲&#xff0c;其原生的卷积网络特征决…

DDR3详解(以Micron MT41J128M8 1Gb DDR3 SDRAM为例)之一

1&#xff0e;结构框图&#xff1a; 2&#xff0e;管脚功能描述 管脚符号 类型 描述 A0-A9,A10/AP,A11,A12/BC#,A13 Input 地址输入。为ACTIVATE命令提供行地址&#xff0c;和为READ/WRITE命令的列地址和自动预充电位&#xff08;A10&#xff09;&#xff0c;以便从某个ba…