Машинное обучение (ML) в наши дни является такой шумихой. В сети много информации: грандиозные обещания, теоретические объяснения, выдуманные варианты использования, проекты GitHub. Слишком примитивно или слишком научно.
Меня очень интересует искусственный интеллект, и я хочу получить примеры из реальной жизни. Что уже есть, что работает, практические услуги, использовалось и проверено. Это даст мне больше понимания того, как я могу использовать ML для проектов или для своей выгоды прямо сейчас.
Не найдя практического списка или классификации использования, я решил составить его сам и поделиться с вами.
Прежде чем мы продолжим. Я не рекламирую услуги или веб-сайты, перечисленные в качестве примеров ниже; и я не настаиваю на использовании любого из них.
Классификация.
Основа. Машинное обучение - это способ для компьютеров обрабатывать данные и выполнять задачи, как это делают люди. Данные - самая важная часть этого процесса. Вот почему я выбрал типы данных в качестве основных элементов классификации.
5 основных типов данных, в которых машины справляются отлично, а иногда и превосходят людей: изображения, видео, текст, аудио, необработанные данные. Если я что-то упустил, поделитесь, пожалуйста, со мной и другими! Я люблю учиться.
Картинки.
Изображения - огромная часть истории человечества: черно-белые фотографии, снимки, сделанные камерой Polaroid или смартфоном с двумя объективами. Много данных. Неудивительно, что это одна из важнейших областей применения машинного обучения. Изображение - это хороший способ для машины постигать мир, это часть более крупной вещи, называемой компьютерным зрением. Какая практическая польза от обработки изображений сегодня?
Классификация и категоризация. Соберите информацию с изображения, поместите его в категорию «кошка». Используется Google в Google Фото и Картинках Google, Yelp для местных предприятий (маркировка и категоризация).
Распознавание предметов и людей. Определяйте предметы или людей на изображении. Используется Pinterest.
Распознавание лиц. Самым известным из них является распознавание лиц Facebook.
Создание изображения. Создайте новое изображение на основе истории просмотренных изображений. Deep Dream - очень хороший пример этого, проверьте его, если вы еще этого не сделали: https://deepdreamgenerator.com/. Результаты потрясающие.
Обработка или улучшение изображения. Помните все эти мемы о бесконечном увеличении в фильмах? Что ж, мы ближе к этому, чем вы думаете: https://letsenhance.io. Обработка изображений также используется в Google Brain (медицинские диагнозы). Другой вариант использования: восстановление цвета от Algorithmia (https://demos.algorithmia.com/colorize-photos/).
Распознавание символов. Примеры: https://www.infrrd.ai, Google Translate.
Анализ. Adobe Sensei, https://www.adobe.com/sensei.html - обнаружение поддельного (измененного) изображения.
Видео.
Этот тип данных очень близок к изображению, за исключением движения. Также применяются все алгоритмы обработки, такие как анализ, обнаружение объектов, распознавание лиц. Товары и услуги: https://www.boulderai.com/, https://www.camio.com/.
Отслеживание объектов. Дроны DJI работают с использованием технологии ActiveTrack, которая позволяет им следовать за человеком или объектом во время полета. Https://www.dji.com/products/drones
Текст.
В реальном мире мы общаемся с помощью текста (по крайней мере, пока, пока Neuralink не представит нам какой-то другой интерфейс связи). Понимать текст - непростая задача для машин. ML открыл совершенно новый мир возможностей для обработки текста.
Понимание смысла. Это огромная группа сама по себе. Используется в поисковых системах (лучший пример здесь - Google). Персональные помощники, такие как Siri от Apple, Alexa от Amazon или Google Now, используют возможности машинного обучения. Спросите погоду или вы Скайнет? (работает с Google Now), и вы получите ответ. Чат-ботам, нравится этот продукт: https://www.zendesk.com/answer-bot/. Конкретное использование: Instagram - смайлы для перевода текста, Twitter - сроки и предложения.
Общая обработка. Google Translate для определения языка и переводов. Turnitin (http://turnitin.com/) для выявления плагиата в текстах.
Генерация текста. BMW Dragon Drive! система обмена сообщениями. Платформа отчетности Vphrase (https://www.vphrase.com/).
Аудио.
Голос в текст. Сейчас большинство сервисов используют преобразование голоса в текст, а затем продолжают текст. «О'кей, Google» является примером. Китайский поиск Baidu использует голосовой поиск и приложения.
Поколение. Google Duplex (автоматические телефонные звонки).
Анализ. Pindrop (https://www.pindrop.com) - анализ голосовых вызовов для выявления мошенничества.
Обработка. Смеситель Neutron 2 от iZotope (https://www.izotope.com/en/products/mix/neutron.html).
Необработанные данные.
Общая обработка. Это самый широкий доступный раздел, основанный на обработке конкретных данных. Мы говорим здесь о больших данных. Объемы огромны, и люди не могут постичь такой объем информации без обобщения. ML находит сходства, тенденции, исключения.
Список примеров большой. Карты Google - прогноз трафика. UberEATS - примерное время доставки еды. Netflix - видео рекомендация. Spotify - музыкальная рекомендация. Instagram - подписчики и связи. Qubit Aura и Amazon - рекомендации по покупкам. LinkedIn - связи людей. Gmail - обнаружение спама. PayPal - обнаружение мошенничества. Facebook - люди, которых вы, возможно, знаете. Salesforce Einstein - прогнозы бизнес-данных. Рекомендации Twitter. SAP (https://www.sap.com) - прогнозы и обслуживание Интернета вещей.
Сложное поведение.
Опыт обработки простых данных позволил нам двигаться дальше. Объедините результаты обработки разных наборов данных и получите сложное поведение. Это позволило Tesla вывести на массовый рынок автопилот, Waymo - разработать автономный автомобиль, а BostonDynnamics - создать своих безумных роботов.
API.
Почему все эти кейсы так полезны? Все они уже хорошо протестированы. Вам не нужно изобретать колесо, чтобы использовать их в своих проектах прямо сейчас. Просто используйте доступные API.
Google Cloud Vision API предлагает поиграть с изображениями здесь: https://cloud.google.com/vision/. IBM предлагает Watson: https://www.ibm.com/watson/products-services/. Сервис Microsoft Azure: https://azure.microsoft.com/en-us/overview/ai-platform/. Если вы работаете с естественным языком, вы можете использовать Wit.Ai на https://wit.ai/. Также существует сервис Amazon AWS для машинного обучения: https://aws.amazon.com/machine-learning/. Доступ к машинному обучению еще никогда не был таким простым!
ML не стоит на месте, предоставляя нам больше возможностей в ближайшем будущем. Как этот: создание замедленного видео от NVIDIA (https://news.developer.nvidia.com/transforming-standard-video-into-slow-motion-with-ai/)
Следите за новостями, и в вашей жизни произойдет еще что-то необычное!
Фото Bence ▲ Boros на Unsplash