深度学习在二十世纪最后十年开始流行。如今,它是最受欢迎的机器学习方法之一,提供了其他架构无法提供的机会。使用深度学习的 OCR 涉及使用神经网络为老问题提供新的解决方案,并重振企业主和 ML 工程师的兴趣。
本文需要对 OCR 和机器学习有入门级以上的了解,重点是深度学习和神经网络。
什么是深度学习?
信息时代是关于人工智能的。这对消费者来说是件好事,它可以帮助企业繁荣,而且它通常是人类文明发展的明显标志之一,机器做了很多肮脏或无聊的工作。技术不断发展,为我们周围的世界提供了更新更好的自动化方法。尽管如此,与人工智能及其智能儿童机器学习相比,深度学习还不太为广大公众所知。
然而,不要被欺骗了:造成这种差异的原因在于,与人工智能领域(如今这实际上是一个家喻户晓的词)或机器学习方法相比,深度学习主题要具体和复杂得多。
那么什么是深度学习呢?深度学习是机器学习的一个子集,包括一系列最常基于受人脑功能启发的神经网络原理构建的方法。
“深度学习”中的“深度”是指用于执行单独任务的多个层,这对应于神经网络的结构化性质。这意味着复杂的任务可以通过单个经过训练的模型来完成,这是线性算法不可能实现的。
例如,图像识别任务是深度学习实际应用的常见示例。最低层识别感兴趣对象的边缘,而最高层识别并分类相关对象,例如人脸。在 OCR 中,神经网络的较低层可能会类似地识别字母的边缘,但理解单词的意义是较高层的工作。但我们会到达那里;让我们一步一步来。
深度学习与神经网络有什么不同吗?
人工神经网络(ANN,也简称为神经网络)是深度学习最常见的基础,但它们并不是同义词。ANN 包括:
- 神经元(处理器)聚合成层;
- 松散地基于生物神经元和突触的边缘(发射器)。
边缘在神经元之间传递信号,权重系统控制信号的强度。随着模型训练的继续,权重会发生变化,从而实现学习过程。
尽管人工神经网络的灵感来自于生物大脑,但其架构相似性却相当模糊。有机大脑和人造大脑之间存在多种差异(例如,我们的大脑是模拟的;而人工神经网络是象征性的)。虽然人工神经网络自然不如生物神经网络复杂,但它们在完成其设计要解决的任务时非常有效。
深度学习要解决的几个问题
除了 OCR 之外,深度学习在现实生活中还有相当多的应用,这使得该方法系列如今如此流行。我们将向您介绍其中的一些内容,只是为了让您大致了解神经网络的功能。
深度学习图像识别
从简单的图像分类到面部分析再到医学扫描分析,图像识别是重要的深度学习任务之一。通过模型的多个层次,可以在各种领域工作,即使对人类来说也是有问题的。奇怪的是,自 2011 年以来,一些深度学习图像识别系统已经变得比人类更准确。
用于语音识别的神经网络
深度学习最好解决的另一组传统任务是语音识别。Siri、Alexa、Google Now、Cortana 等虚拟助手都拥有基于深度学习架构的核心。该技术通过覆盖更大的词汇量、识别口音和方言以及改进解释而不断发展
使用深度学习进行客户关系管理
虽然大多数深度学习模型都基于监督机器学习,但某些任务需要其他形式的机器学习。CRM提供了一些最好通过采用深度强化学习来解决的任务。它可以预测长期营销策略步骤的价值,如果不利用深度学习,这一壮举是不可能实现的。