Публикации по теме 'data'


Создайте модель машинного обучения менее чем за 5 минут 🚀🔥🧠
В этой статье мы увидим, как всего за несколько минут построить модель машинного обучения с помощью популярной библиотеки Python scikit-learn. Предположим, у вас есть набор данных о покупателях торгового центра. Набор данных содержит информацию о возрасте, поле, доходе и оценке расходов каждого клиента. Оценка расходов рассчитывается на основе прошлых моделей расходов клиента. Вы хотите создать модель машинного обучения, которая может предсказать оценку расходов клиента с учетом его..

Создание платформы аннотаций с нуля
Создание платформы для аннотаций с помощью Argilla Введение Поскольку аннотации имеют решающее значение для обеспечения качественных данных для проектов обработки естественного языка (NLP). Основная идея проекта — предоставить простой и интуитивно понятный пользовательский интерфейс для эффективного аннотирования любого набора данных. Платформа имеет два API, один для уровня приема, а другой для уровня обслуживания, чтобы упростить процесс интеграции с другими приложениями. API приема..

онлайн-соревнования Каждый специалист по данным и соискатель должен знать
1.Kaggle- https://www.kaggle.com/ kaggle-решения https://github.com/faridrashidi/kaggle-solutions 2.hackerearth- https://www.hackerearth.com/challenges/ 3.machinehack- https://www.machinehack.com/ 4.analyticsvidhya- https://datahack.analyticsvidhya.com/contest/all/ 5.zindi- https://zindi.africa/competitions 6.crowdai- https://www.crowdai.org/ 7.driven data- https://www.drivendata.org/ 8.dockship- https://dockship.io/Runway ИИ 9.Конкурс SIGNATE-..

Превращение новостей в данные — День 5
14 августа 2022 г. Поэтому я думаю, что у меня больше нет ограничений по скорости, поэтому я продолжу использовать исходный код. На этот раз, однако, я собираюсь поместить его в шаблонный код rest API. Одна вещь, которой не хватает в Python, — это тип package.json , который есть в JS, где вы можете размещать там скрипты. Я полагаю, что мог бы обойти это с помощью библиотеки cli В любом случае, что я думаю сделать, так это создать новую папку src/api/cluster_trends и превратить..

Возможности цифровой трансформации данных и машинного обучения в Индустрии 4.0
Индустрия 4.0 штурмом взяла обрабатывающую промышленность, изменив производственный процесс, используемый для производства товаров, которые мы потребляем ежедневно. Четвертая промышленная революция, или для краткости Индустрия 4.0, включает в себя внедрение и использование технологий в производственном процессе. В Индустрии 4.0 информационные системы, устройства IoT (Интернет вещей), облачные сервисы и различные компьютеры работают совместно для сбора и обработки соответствующих данных,..

Исследовательские работы для чтения о разработках в области структур данных и алгоритмов, часть 2
Результаты сложности для задачи о несоответствии Уивера ( arXiv ) Автор: Дэниел А. Спилман , Пэн Чжан Аннотация: Маркус, Спилман и Сривастава [MSS15] решили проблему Кадисона–Зингера, доказав сильную форму гипотезы Уивера: они показали, что для всех √α › 0 и всех списков векторов нормы не более √α, сумма внешних произведений которых равна единице, существует знаковая сумма этих внешних произведений с операторной нормой не более √8α + 2α. Доказано, что NP-трудно отличить..

В погоне за данными: коронавирус
В погоне за данными: коронавирус О полезности (или полезности) аналитики больших данных на наличие коронавируса (пока) Пролог: Эбола Раньше, когда я тратил много времени на проекты управления социальными сетями в чрезвычайных ситуациях (SMEM) Информация о вирусе Эбола и Коалиция социальных сетей Эбола (особенно на файлы , которые я хранил), я часто оставался в погоне за данными. Сообщения, даже из официальных правительственных источников, часто были противоречивыми,..