ИИ как экосистема, бизнес и рынок
Инфраструктурные и сервисные решения для поддержки ИИ
Начнем с уровня аппаратного обеспечения и перечислим основные направления, в которых специализируются компании, занятые в создании ИИ-решений.
Аппаратное обеспечение, оптимизированное под задачи в области ИИ. В данной категории поставщики классифицируются по четырем подкатегориям. Разработчики аппаратного обеспечения (серверы, сетевое оборудование, СХД), оптимизированного под ИИ-нагрузки. Разработчики специализированных процессоров (GPU, TPU и т. п.). Производители периферийных устройств, обеспечивающих ИИ-функциональность.
Как было отмечено выше, в данной классификации к аппаратному обеспечению относят также системы обеспечения интерфейса "мозг-компьютер" - устройства, которые позволяют напрямую передавать электрические сигналы от нейронов к внешнему электронному устройству (компьютеру, экзоскелету, протезу и т. п.). Передача импульсов мозга к исполнительному аппарату происходит минуя нервно-мышечные пути, например, позволяя, парализованному человеку пользоваться курсором. Различают инвазивные (вживляются в мозг), малоинвазивные (располагаются на поверхности мозга) и неинвазивные (помещаются на голове) нейроинтерфейсы. Для реализации данной технологии необходимы специализированные чипы и другие программно-аппаратные средства.
Big Data-платформы, оптимизированные для ИИ-проектов. Большие данные и искусственный интеллект связаны синергетически. Технологии часто работают в связке - аналитика больших данных использует ИИ для более эффективного анализа данных, в то время как ИИ требует огромного количества данных для обучения и улучшения процессов принятия решений. В указанной категории выделяется две подкатегории: собственно платформы Big Data, оптимизированные для ИИ-проектов, и платформы визуализации больших данных.
Дата-сайнс-платформы. Данная категория объединяет поставщиков платформ, предназначенных для решения задач дата-сайнс и при этом имеющих специфические функции для выполнения ИИ-проектов. В упомянутой категории различают собственно провайдеров платформ со встроенной поддержкой ИИ и поставщиков систем управления проектами ИИ.
В первую подкатегорию относят поставщиков платформ, включающих поддержку широкого набора ИИ-алгоритмов, с возможностью оптимизации гиперпараметров, поддержки спектра инструментов и библиотек ИИ, а также возможностью операционализации моделей, определенных в системе.
Ко второй подкатегории относят поставщиков инструментов, обеспечивающих управление процессами, ориентированными на данные, позволяющих управлять моделями, следить в крупных проектах за сотнями экспериментов и десятками наборов характеристик данных.
Вопросы управления проектами становятся все более актуальными по мере создания интегрированных сложных систем. Одним из основных факторов успеха ML-проекта является принятие или адаптация метода управления проектами. Более 80% специалистов по исследованию данных отмечают необходимость более систематического применения методов управления ML-проектами [121].
Подготовка и обработка данных для ИИ. Функции компаний, занятых в выполнении данного вида работ, мы уже достаточно подробно рассмотрели. Отметим лишь, что в данном разделе Cognilytica предлагает делить поставщиков услуг на две группы - это компании, занятые подготовкой данных для повышения их качества и полезности, и компании, занятые разметкой данных.
Опорные технологии для ИИ
Под опорными подразумеваются технологии, позволяющие реализовать определенные решения, на основе которых другие игроки рынка могут создавать свои собственные ИИ-приложения. В данной категории выделяется шесть подкатегорий провайдеров, поставляющих нижеперечисленные решения.
Платформы машинного обучения. В данном разделе рассматриваются поставщики платформ для разработки приложений машинного обучения и операционализации решений ИИ для разных сценариев использования и требований к развертыванию. Эти платформы могут представляться в виде локального или облачного решения. Cognilytica рассматривает шесть подкатегорий поставщиков.
Платформы для разработчиков ML-приложений - средства разработки ИИ-приложений и операционализации ИИ-моделей, ориентированные на разработчиков, производящих обучение моделей в локальных дата-центрах.
Облачные платформы с ИИ-функционалом - средства разработки, предоставляющие широкий набор дата-сайнс-инструментов, средств обучения и развертывания моделей в облаке. Платформы ориентированы на технических специалистов.
ИИ как услуга (MLaaS), шаблоны и low code-инструменты для упрощения разработки и операционализации моделей, ориентированные на нетехнических специалистов.
Платформы для разработки периферийных решений. Инструментарий, предназначенный для разработки и реализации ИИ-решений в периферийных устройствах, имеющих ограниченные вычислительную мощность и объем памяти.
Платформы для автоматизации разработки ML-приложений - решения, направленные на автоматизацию разработки ML-приложений, включая выбор алгоритмов, настройку гиперпараметров и т. п.
Компьютерное зрение. Раздел объединяет следующие типы компаний.
Провайдеры платформ для построения систем полного цикла, включая распознавание, поиск и анализ изображений или видео.
Поставщики, специализирующиеся непосредственно на распознавании изображений и объектов - компании, фокус которых направлен на распознавании лиц и жестов.
Фирмы, предлагающие решения для поиска и извлечения информации на изображениях, которые позволяют классифицировать изображения, создавать подписи или описания изображений и видео-контента.
Поставщики систем оцифровки реального мира, создания 3D-представлений среды, восстановления 3D-сеток по плоским изображениям и т. п.
Понимание естественного языка. Здесь выделяются компании, занятые созданием ИИ-продуктов по нижеперечисленным направлениям.
Разработчики систем генерации естественного языка (генерации контента на естественном языке); NLP-системы, способные понимать естественную речь.
Разработчики систем, способных к пониманию здравого смысла, что включает построения систем машинного рассуждения, онтологий и графов знаний.
Поставщики систем машинного перевода, о технологических основах которого мы достаточно подробно рассказали в первой лекции.
КонтентныеИИ-технологии. В данном разделе подразумеваются компании, использующие ИИ для обеспечения распознавания и понимания содержания документов. Здесь можно выделить поставщиков, разрабатывающих ИИ-решения в трех направлениях.
Захват данных и анализ документов (захват данных в нецифровом формате, распознавание документа и вычленение смысла документа).
Резюмирование контента - получение контента в цифровом формате и составление на его основе резюме. Например, создание протокола по тексту совещания.
Анализ неструктурированных данных - обработка различного рода неструктурированных данных, сбор и выявление взаимосвязи между данными.
Говоря о поставщиках контентных технологий, полезно упомянуть интеграцию последних со средствами RPA (Robotic Process Automation). Речь идет об автоматизации с помощью программных ботов рутинных повторяющихся задач, таких как извлечение текста из документов, перенос данных из одной системы в другую, выставление счетов и т. п. Среди функций RPA можно упомянуть способность открывать электронную почту и вложения, входить в приложения, перемещать файлы, заполнять формы, осуществлять чтение и запись в базы данных, собирать данные из Интернета, извлекать структурированные данные из документов и т. п.
Объединение интеллектуальной обработки документов с RPA позволяют создавать решения, которые могут обрабатывать документы, интерпретировать информацию, принимать решения на основе соответствующих данных.
Опорные технологии для беспилотных аппаратов. В данной категории рассматриваются производители систем, на базе которых создаются беспилотные машины. Эти производители делятся на две подкатегории.
Поставщики аппаратных средств для беспилотников. Имеются в виду системы, позволяющие ориентироваться транспортному средству во внешней среде, распознавать объекты и сцены, а также сетевые решения, на базе которых осуществляется соответствующий инфо