Машинное обучение: классификация использования, типы данных и примеры.

Машинное обучение (ML) в наши дни является такой шумихой. В сети много информации: грандиозные обещания, теоретические объяснения, выдуманные варианты использования, проекты GitHub. Слишком примитивно или слишком научно.

Меня очень интересует искусственный интеллект, и я хочу получить примеры из реальной жизни. Что уже есть, что работает, практические услуги, использовалось и проверено. Это даст мне больше понимания того, как я могу использовать ML для проектов или для своей выгоды прямо сейчас.

Не найдя практического списка или классификации использования, я решил составить его сам и поделиться с вами.

Прежде чем мы продолжим. Я не рекламирую услуги или веб-сайты, перечисленные в качестве примеров ниже; и я не настаиваю на использовании любого из них.

Классификация.

Основа. Машинное обучение - это способ для компьютеров обрабатывать данные и выполнять задачи, как это делают люди. Данные - самая важная часть этого процесса. Вот почему я выбрал типы данных в качестве основных элементов классификации.

5 основных типов данных, в которых машины справляются отлично, а иногда и превосходят людей: изображения, видео, текст, аудио, необработанные данные. Если я что-то упустил, поделитесь, пожалуйста, со мной и другими! Я люблю учиться.

Картинки.

Изображения - огромная часть истории человечества: черно-белые фотографии, снимки, сделанные камерой Polaroid или смартфоном с двумя объективами. Много данных. Неудивительно, что это одна из важнейших областей применения машинного обучения. Изображение - это хороший способ для машины постигать мир, это часть более крупной вещи, называемой компьютерным зрением. Какая практическая польза от обработки изображений сегодня?

Классификация и категоризация. Соберите информацию с изображения, поместите его в категорию «кошка». Используется Google в Google Фото и Картинках Google, Yelp для местных предприятий (маркировка и категоризация).

Распознавание предметов и людей. Определяйте предметы или людей на изображении. Используется Pinterest.

Распознавание лиц. Самым известным из них является распознавание лиц Facebook.

Создание изображения. Создайте новое изображение на основе истории просмотренных изображений. Deep Dream - очень хороший пример этого, проверьте его, если вы еще этого не сделали: https://deepdreamgenerator.com/. Результаты потрясающие.

Обработка или улучшение изображения. Помните все эти мемы о бесконечном увеличении в фильмах? Что ж, мы ближе к этому, чем вы думаете: https://letsenhance.io. Обработка изображений также используется в Google Brain (медицинские диагнозы). Другой вариант использования: восстановление цвета от Algorithmia (https://demos.algorithmia.com/colorize-photos/).

Распознавание символов. Примеры: https://www.infrrd.ai, Google Translate.

Анализ. Adobe Sensei, https://www.adobe.com/sensei.html - обнаружение поддельного (измененного) изображения.

Видео.

Этот тип данных очень близок к изображению, за исключением движения. Также применяются все алгоритмы обработки, такие как анализ, обнаружение объектов, распознавание лиц. Товары и услуги: https://www.boulderai.com/, https://www.camio.com/.

Отслеживание объектов. Дроны DJI работают с использованием технологии ActiveTrack, которая позволяет им следовать за человеком или объектом во время полета. Https://www.dji.com/products/drones

Текст.

В реальном мире мы общаемся с помощью текста (по крайней мере, пока, пока Neuralink не представит нам какой-то другой интерфейс связи). Понимать текст - непростая задача для машин. ML открыл совершенно новый мир возможностей для обработки текста.

Понимание смысла. Это огромная группа сама по себе. Используется в поисковых системах (лучший пример здесь - Google). Персональные помощники, такие как Siri от Apple, Alexa от Amazon или Google Now, используют возможности машинного обучения. Спросите погоду или вы Скайнет? (работает с Google Now), и вы получите ответ. Чат-ботам, нравится этот продукт: https://www.zendesk.com/answer-bot/. Конкретное использование: Instagram - смайлы для перевода текста, Twitter - сроки и предложения.

Общая обработка. Google Translate для определения языка и переводов. Turnitin (http://turnitin.com/) для выявления плагиата в текстах.

Генерация текста. BMW Dragon Drive! система обмена сообщениями. Платформа отчетности Vphrase (https://www.vphrase.com/).

Аудио.

Голос в текст. Сейчас большинство сервисов используют преобразование голоса в текст, а затем продолжают текст. «О'кей, Google» является примером. Китайский поиск Baidu использует голосовой поиск и приложения.

Поколение. Google Duplex (автоматические телефонные звонки).

Анализ. Pindrop (https://www.pindrop.com) - анализ голосовых вызовов для выявления мошенничества.

Обработка. Смеситель Neutron 2 от iZotope (https://www.izotope.com/en/products/mix/neutron.html).

Необработанные данные.

Общая обработка. Это самый широкий доступный раздел, основанный на обработке конкретных данных. Мы говорим здесь о больших данных. Объемы огромны, и люди не могут постичь такой объем информации без обобщения. ML находит сходства, тенденции, исключения.

Список примеров большой. Карты Google - прогноз трафика. UberEATS - примерное время доставки еды. Netflix - видео рекомендация. Spotify - музыкальная рекомендация. Instagram - подписчики и связи. Qubit Aura и Amazon - рекомендации по покупкам. LinkedIn - связи людей. Gmail - обнаружение спама. PayPal - обнаружение мошенничества. Facebook - люди, которых вы, возможно, знаете. Salesforce Einstein - прогнозы бизнес-данных. Рекомендации Twitter. SAP (https://www.sap.com) - прогнозы и обслуживание Интернета вещей.

Сложное поведение.

Опыт обработки простых данных позволил нам двигаться дальше. Объедините результаты обработки разных наборов данных и получите сложное поведение. Это позволило Tesla вывести на массовый рынок автопилот, Waymo - разработать автономный автомобиль, а BostonDynnamics - создать своих безумных роботов.

API.

Почему все эти кейсы так полезны? Все они уже хорошо протестированы. Вам не нужно изобретать колесо, чтобы использовать их в своих проектах прямо сейчас. Просто используйте доступные API.

Google Cloud Vision API предлагает поиграть с изображениями здесь: https://cloud.google.com/vision/. IBM предлагает Watson: https://www.ibm.com/watson/products-services/. Сервис Microsoft Azure: https://azure.microsoft.com/en-us/overview/ai-platform/. Если вы работаете с естественным языком, вы можете использовать Wit.Ai на https://wit.ai/. Также существует сервис Amazon AWS для машинного обучения: https://aws.amazon.com/machine-learning/. Доступ к машинному обучению еще никогда не был таким простым!

ML не стоит на месте, предоставляя нам больше возможностей в ближайшем будущем. Как этот: создание замедленного видео от NVIDIA (https://news.developer.nvidia.com/transforming-standard-video-into-slow-motion-with-ai/)

Следите за новостями, и в вашей жизни произойдет еще что-то необычное!

Фото Bence ▲ Boros на Unsplash