<>人工智能名词表
该表持续不定期更新中!
<>主流深度学习框架:
框架 机构 支持语言
TensorFlow Google Python/C++/Go
Caffe BVLC C++/Python
Keras fchollet Python
CNTK Microsoft C++
MXNet DMLC Python/C++/R
Torch7 Facebook Lua
Theano U.Montreal Python
Deeplearning4J DeepLearning4J Java/Scala
Leaf AutumnAI Rust
Lasagne Lasagne Python
Neon NervanaSystems Python
<>领域常用名词:
* 3D Reconstruction 三维重建:
三维重建技术通过深度数据获取、预处理、点云配准与融合、生成表面等过程,把真实场景刻画成符合计算机逻辑表达的数学模型。这种模型可以对如文物保护、游戏开发、建筑设计、临床医学等研究起到辅助的作用。
* Artificial Intelligence 人工智能:英文缩写为AI,
他是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
* Attitude estimation 姿态估计:
姿态估计问题就是确定某一三维目标物体的方位指向问题。姿态估计在机器人视觉、动作跟踪和单照相机定标等很多领域都有应用。在不同领域用于姿态估计的传感器是不一样的。
* Computer Vision 计算机视觉:
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所
指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提
取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
* Deep Learning 深度学习:
机器学习是实现人工智能的方法,深度学习是实现机器学习的一种技术。并且,在目前来看,深度学习将会淘汰其他的机器学习算法。简单说,深度学习就是一个函数集。
* Face Recognition 人脸识别:
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
* Machine Learning 机器学习:
机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。
* Supervised Learning 监督学习:给一个数据集并且我们已经知道了正确的输出是什么样子的,我们已经知道了输入与输出之间的对应关系。
Unsupervised Learning 无监督学习:
我们能够很少或根本不知道我们的结果应该是什么样的。我们可以从数据中推导出结构但我们不一定知道变量的影响。
regression 回归:我们预测结果在一个连续输出集里。也就是说我们要把输入变量映射到某个连续函数。
classification 分类:我们预测结果在一个离散输出集里。也就是说我们要把输入变量映射到某个离散函数。
clustering 聚类:无监督学习的结果。聚类的结果将产生一组集合,集合中的对象与同集合中的对象彼此相似,与其他集合中的对象相异。
* Target Detection 目标检测:
目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。尤其是在复杂场景中,需要对多个目标进行实时处理时,目标自动提取和识别就显得特别重要。
* Target Recognition 目标识别:
这是一个基于分类的识别问题,即在所有的给定数据中,找出哪些是目标。这个分类的层面往往不是针对像素,而是给定的一些分类,或定义的对象,或图像本身。
* Target Segmentation 目标分割:
假定数据是图像,任务是把目标分割出来。对于一般的光学图像,是要提取哪一些像素是用于表述目标的。问题可以看成是分类问题,即把每一个像素标签化,找出感兴趣的那一类标签对应的像素;也可以是聚类问题,即不知道像素的标签,但通过某些特征可以对像素进行分类区分开。
* Target Tracking 目标追踪:
这个任务涉及的数据一般是时间序列,完成这个任务首先要目标定位。常见的情况是目标被定位以后,算法需要在后面的序列数据中,快速高效地对目标进行再定位。为了避免不必要的重复计算,可以充分利用时间序列的相关性,可能涉及到一些几何变换(旋转,缩放等),运动伪影处理等问题。
<>论文常用名词:
<>Average Precision (AP):
Average Precision,就是对一个Query,计算其命中时的平均Precision。如何衡量一个模型的性能,单纯用 precision 和
recall 都不科学。于是人们想到,哎嘛为何不把 PR曲线下的面积 当做衡量尺度呢?于是就有了 AP值 这一概念。这里的
average,等于是在单个类别的总样本个数当中对 precision 进行 取平均 。
<>F-Measure 也叫做 F-Score:
F-Measure是Precision和Recall加权调和平均:
F=(a2+1)P∗Ra2(P+R) F = \frac{(a^2 + 1)P * R}{a^2(P + R)} F=a2(P+R)(a2+1)P∗R
当参数a=1时, 就是最常见的F1了:
F1=2PRP+R F1 = \frac{2PR}{P+R} F1=P+R2PR
很容易理解,F1综合了P和R的结果,当F1较高时则比较说明实验方法比较理想。
<>IOU:
在目标检测中,IoU这一值,可以理解为系统预测出来的框与原来图片中标记的框的重合程度。计算方法即检测结果Detection Result与 Ground
Truth 的交集比上它们的并集,即为检测的准确率:
<>mAP:
Mean Average Precision,即 平均AP值 。mean表示不同的类别之间取平均。是对多个验证集个体 求 平均AP值 。如下图:
mAP=1QR∑q∈QRAP(q) mAP = \frac{1}{Q_R}\sum_{q\in Q_R}AP(q) mAP=QR1q∈QR∑AP(q)
<>Precision:
Precision计算的是所有被检索到的item中,应该被检索到的item所占的比例,就是在识别出来的图片中,True positives所占的比例:
precision=tptp+fp=tpn precision = \frac{tp}{tp+fp}=\frac{tp}{n} precision=tp+fp
tp=ntp
关于tp等参数,参考博客:https://blog.csdn.net/mdjxy63/article/details/79822555
<https://blog.csdn.net/mdjxy63/article/details/79822555>
Precision 精确率和Recall 召回率虽然没有必然的关系, 然而在大规模数据集合中,这两个指标确是相互制约的。
由于“检索策略”并不完美,希望更多相关的文档被检索到时,放宽“检索策略”时,往往也会伴随出现一些不相关的结果,从而使准确率受到影响。
而希望去除检索结果中的不相关文档时,务必要将“检索策略”定的更加严格,这样也会使有一些相关的文档不再能被检索到,从而使召回率受到影响。
<>Recall:
Recall 是被正确识别出来的个数与测试集中所有该标签个数的比值:
recal=tptp+fn recal = \frac{tp}{tp+fn} recal=tp+fntp
<>Threshold Value:
可以通过调整阈值,来选择让系统识别出多少图片,进而改变Precision 或 Recall 的值。
热门工具 换一换