人工智能书单之(2)计算机视觉(上)

前面介绍了人工智能综述相关的畅销书以及经典技术书籍和教程,全面接触和了解人工智能的各个方面的基础数学理论,前沿技术和经典算法,接下来就涉及到如何将人工智能应用到实际场景中的技术方向,才是AI技术的重点所在。


前面介绍过人工智能应用方向的几个重要分支:


1. 计算机视觉

2. 自然语言处理

3. 数据智能和BI

4. 知识和推理

5. 机器人学


这篇文章先从计算机视觉方向介绍,因为计算机视觉是目前应用最广泛,也最重要的方向,比如我们现在到处都要的刷脸,视频检测,也是未来自动驾驶,机器人的重要基础。不论是无人汽车,还是无人机,自动机器人,想要形成AI智能,并自主进行行动和完成任务,首先需要学习人类一样从外界获取各种信号的反馈,来指导下一步的动作和决策,视觉信号是最直观,最有效,信息量最丰富的信号(语音信号是另一个直观的输入,相应的语音信号处理和识别再单独介绍),所以拥有计算机视觉CV是最基本的需求之一。


但是计算机视觉的获取并不容易,难点不在于如何获取图形,影像信号,并进行数字化,离散化,也不在于视频大数据量的传输,存储和实时处理,真正的难点在于视觉理解,如何像人一样从看到的东西中理解他看到的真正的含义,这是CV的终极目标和努力方向,但是前面的问题也需要逐一解决,所以CV基本包含的一系列的知识步骤,这其中最基础的大学学科知识源于数字电路,数字信号处理,和离散数学,其中进一步也用到信息论,密码学,分布式网络,以及进行视觉理解和认知的机器学习和深度学习等统计学和神经网络的知识。所以需要有一定的计算机理论和数学知识基础为前提。


下面可以简化下,只专注于CV领域,一般我们的学习路径包括:


数字图像处理=》模式识别=》视频编码和识别=》计算机视觉理论=》计算机视觉工具


想要机器看到世界,先要看懂图像:


一、数字图像处理


数字图像处理涉及到的重点知识包括:


(1)数字图像表示

(2)各种图像处理算法(滤镜)

(3)图像抠图

(4)目标检测

(5)图像渲染等


这里重点关注图像处理和检测方面,推荐电子和通信系列的国外经典教材:


1. 国外电子与通信教材系列:数字图像处理(第四版)


人工智能书单之(2)计算机视觉(上)


以及matlab的应用实践,matlab是这领域研究的必备工具


2. 数字图像处理(MATLAB版)(第二版)(本科教学版)


人工智能书单之(2)计算机视觉(上)


二、模式识别


模式识别的目标在于通过一系列监督或非监督的算法,来从各种信号中识别出有规律的模式,或者特定的模型,或者进行自动分类等数字信号处理任务,这对于人脸建模,识别,视频目标的识别,运动检测,活体检测都是最基础的算法支持。


常见的模式识别任务包括:分类和识别


常用的模式识别方法偏重于无监督的策略,自动发现和识别信息数据中存在的模式比如,聚类,主成分分析等。

也包括有监督的SVM,以及基于概率的贝叶斯分类器等统计学和机器学习方法。


还是先来经典教材:


1. 模式识别(第四版)(修订版)


人工智能书单之(2)计算机视觉(上)


2. 模式识别与智能计算 MATLAB技术实现 第4版


人工智能书单之(2)计算机视觉(上)


这是基于matlab的实现。


3. 模式识别(模式识别与机器学习(第4版))


人工智能书单之(2)计算机视觉(上)


侧重机器学习的方法与模式识别的结合


三、数字视频处理


图像处理是对静态的数字影像的处理和识别,视频则是动态的视频影响,更接近与人类眼睛的信号输入,所以针对视频的处理的研究由来已久,视频处理主要关注几个技术方向:


(1)视频编解码:针对如何对较大的视频数据进行压缩,便于传输和保存,但是又不损失太多的精度导致视频失真。


主流的视频编解码标准包括MPEG系列,ITU-T系列H.263,H.264,H.265,以及一些商用公司的算法标准。


视频编解码的目标是既保证计算的实时性,又保证较小的信号损失。


(2)视频目标检测:用来从视频实时数据中检测出具有某种特征的物体,并在每一帧中进行跟踪,比如车牌抓拍识别,人脸检测,运动物体检测,人流统计预警等。


(3)视频合成:用于双目视觉或多角度摄像机产生的多角度,甚至全维度的多路视频输入,如何通过对于同一时刻同一目标场景,合成与人眼双目所看的相似的视觉效果,或者形成全息影像的呈现。


简单推荐几本教材。


1. 数字视频处理(原书第2版)


人工智能书单之(2)计算机视觉(上)


2. 视频编码全角度详解:AVS China、H.264/MPEG-4 PART10、HEVC、VP6、DIRAC、VC-1 [Video Coding Standard]


人工智能书单之(2)计算机视觉(上)


3. 多媒体技术教程(原书第2版)


人工智能书单之(2)计算机视觉(上)


未完待续,敬请关注(下),接下来对计算机视觉和CV工具如何学习进行介绍。

展开阅读全文

页面更新:2024-04-15

标签:人工智能   视觉   计算机   书单   算法   信号   方向   目标   数字   系列   视频

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top