или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

Яндекс представил систему машинного обучения CatBoost (+видео)

schedule 21.07.2017 в 05:43 link CatBoost яндекс Россия
Яндекс открыл доступ к своей системе машинного обучения под названием CatBoost. Эта технология позволяет обучать модели с разнородными данными очень эффективным способом. Библиотека CatBoost имеет открытый доступ, поэтому её могут использовать все желающие, - сообщает Robotics.ua



Что это?

CatBoost появилась вследствие работы системы Матрикcнет, которая использовалась во множестве сервисов Яндекса. Новый метод работает через механизм градиентного бустинга, который хорошо зарекомендовал себя в работе с разнородными данными. Обычно специалист, который работает с машинным обучением, может создать свой интеллектуальный способ трансформации категориальных признаков в числовые, но, как минус, такая обработка данных приводит к потере части информации и ухудшению качества результата.

Таким образом, инженеры Яндекса работали над тем, чтобы система обучения машины смогла взаимодействовать не только с числами, но и напрямую с категориями с целью выявлять самостоятельно закономерности между данными без помощи программиста. В результате вышел CatBoost, который способен работать как с числовыми признаками, так и с нечисловыми. То есть, эти данные могут использоваться в первоначальном виде. Система демонстрирует более высокое качество обучения, работая с разнородными данными. И это позволяет применять её в различных областях — от банковского дела до промышленности. 



Практические испытания CatBoost

CatBoost уже был протестирован на нескольких сервисах Яндекса, в частности, для улучшения результатов поиска, ранжирования ленты рекомендаций Яндекс.Дзен, а также для расчета прогноза погоды в сервисе Метеум. Во всех сервисах система показала лучшие результаты, чем Матрикснет.

Кроме того, CatBoost уже был испытан в рамках сотрудничества с Европейской организацией по ядерным исследованиям, и в частности, в работе Большого адронного коллайдера (БАК). Суть в том, чтобы точно отслеживать частицы, регистрируемые в эксперименте, детектор использует несколько специфических частей, каждая из которых определяет специальные свойства разных частиц.

Сложность задачи здесь заключается в объединении информации с различных частей детектора в максимально точное сформулированное знание о частице. Машинное обучение – самое эффективное решение этой задачи. Используя систему CatBoost, ученые БАК смогли значительно улучшить определение качественных характеристик частиц. Результаты CatBoost оказались лучше тех, что были получены с помощью других методов.

Как использовать CatBoost?

Согласно robotics.ua, начать работу с CatBoost очень просто. Для этого нужно просто установить библиотеку на свой компьютер. Она работает в Linux, Windows и macOS, а также доступна на языках Python и R. Более того, Яндекс разработал программу визуализации CatBoost Viewer, которая позволяет следить за процессом обучения с помощью графиков.

Напомним, что кроме машинного обучения Яндекс всерьез занялся технологиями автономного движения и даже уже представил свой первый прототип беспилотного автомобиля.

Комментарии: