公司将人工智能应用于服务运营、服务或产品设计、广告和销售。在投资方面,药物发现和开发领域获得的资金最多——2020年,资产总额超过138亿美元,比上年增长4.5倍。
如果应用于库存和零件优化、定价和促销、客户服务分析、销售和需求预测,人工智能将推动最高的收入增长。报告成本降低的用例与优化人才管理、联络中心自动化和仓库自动化有关。
在2021年和接下来的几年里,人工智能将被用来简化运营并提高效率。企业应尝试通过改善IT基础设施和数据管理,从人工智能的商业应用中受益。但并非每个部署的AI模型都可以对公司有所帮助并适用于绩效监控。我们将关注可能成为主流的2021-2022年人工智能趋势。
人工智能技术已经应用于人脸识别、语音识别和视频分析。这些技术构成了监视的最佳组合。因此,到2021年,我们可以预见人工智能在视频监控中的大量利用。
人工智能有利于安全系统的灵活设置。以前,工程师花费大量时间配置系统,因为它会在屏幕上特定数量的像素发生变化时被激活。所以,误报太多了。这些警报是由落叶或奔跑的动物引起的。多亏了人工智能,安全系统可以识别物体,这有助于更灵活的设置。
视频监控中的人工智能可以通过关注异常行为模式而非面部来检测可疑活动。这种能力可以通过识别潜在威胁来创建更安全的公共和私人空间。这种人工智能驱动的视频解决方案也可能有助于物流、零售和制造。
另一个为人工智能应用提供前景的利基是语音识别。与语音识别相关的技术可以确定身份。身份是指一个人的年龄、性别和情绪状态。用于监控的语音识别所基于的原理可能与Alexa或Google Assistant的情况相同。一个适用于安全和监视的功能是内置的反欺骗模型,可检测合成和录制的语音。
最关键的安全技术之一是生物特征人脸识别。不同的恶意应用程序试图通过提供虚假照片而不是真实图像来欺骗安全系统。为了防范这种情况,目前正在开发和大规模使用多种反欺骗技术。
处理实时视频流的挑战是处理数据管道。工程师的目标是确保准确性并最大限度地减少视频处理的延迟。而人工智能解决方案可以帮助实现这一目标。
为了在实时视频处理中实现基于AI的方法,我们需要一个预训练的神经网络模型、一个云基础设施和一个用于应用用户场景的软件层。处理速度对于实时流传输至关重要,因此所有这些组件都应紧密集成。为了更快的处理,我们可以并行化进程或改进算法。进程并行化是通过文件拆分或使用管道方法实现的。这种流水线架构是最佳选择,因为它不会降低模型的准确性,并且允许使用AI算法实时处理视频而没有任何复杂性。此外,对于管道架构,可以应用暗示面部检测和模糊的附加效果。
现代实时流处理与背景去除和模糊的应用密不可分。由于医疗卫生事件对视频会议新趋势的出现和普及做出了贡献,对这些工具的需求有所增加。这些趋势将得到积极发展,因为据GlobeNewswire称,全球视频会议市场预计将从2021年的92亿美元增长到2026年的225亿美元。
有多种方法可以开发用于实时视频中背景去除和模糊的工具。挑战在于设计一个能够将框架中的人与背景分开的模型。可以执行此类任务的神经网络可以基于现有模型,如BodyPix、MediaPipe或PixelLib。选择模型后,仍然面临着将其与适当框架集成并通过WebAssembly、WebGL或WebGPU的应用程序组织最佳执行过程的挑战。
现代AI模型可以生成非常高质量的文本、音频和图像,几乎与非合成的准确数据无法区分。
文本的核心是自然语言处理(NLP)。NLP的快速发展导致了语言模型的出现。例如,谷歌和微软成功地使用BERT模型来补充他们的搜索引擎。
与NLP相关的技术的发展还能如何推动公司发展?首先,结合NLP和AI工具可以创建聊天机器人。据Business Insider称,聊天机器人市场预计在2024年将达到94亿美元,所以让我们强调企业从AI驱动的聊天机器人实施中受益的方式。
聊天机器人试图了解人们的意图,而不仅仅是执行标准命令。在不同领域工作的公司使用人工智能驱动的聊天机器人为其客户或用户提供人类级别的交流。聊天机器人的应用广泛应用于以下业务领域:医疗保健、银行、营销、旅游和酒店。
人工智能驱动的聊天机器人有助于自动化管理任务。例如,在医疗保健领域,他们减少了体力劳动。在这里,聊天机器人帮助安排约会,发送与服药相关的提醒,并为患者提供问题的答案。在其他领域,聊天机器人被引入来传递有针对性的信息,提高客户参与度和支持,并为用户提供个性化的服务。
除了聊天机器人,NLP是其他尖端技术解决方案的核心。示例之一是可用于业务应用程序的NLP文本生成。
最近推出的GPT-3模型使AI工程师每天平均可以生成45亿个单词。这将使AI的大量下游应用能够用于对社会有益和价值较低的目的。这也促使研究人员投资于检测生成模型的技术。请注意,在2021-2022年,我们将见证GPT-4——“人工通用智能AI”的到来。
回到生成式AI,我们要关注GAN,即生成式对抗网络,它能够创建与人工生成的图像无法区分的图像。这可能是不存在的人、动物、物体和其他类型媒体(例如音频和文本)的图像。现在是实施GAN发挥其能力的最佳时机。他们可以对真实数据分布进行建模并学习有用的表示,以改进AI管道、保护数据、发现异常并适应特定的现实世界案例。