Новости


Нейрокурятник часть 3. Про разметку кур

И про то, что у кур тоже бывают психи. Птица beauty в гнезде Одна не сильно впечатляющая статья про разметку изображений кур. Статьи про нейрокурятник Заголовок спойлера Вступление про обучение себя нейросетям Железо, софт и конфиг для наблюдения за курами Бот, который постит события из жизни кур — без нейросети Разметка датасетов Работающая модель для распознавания кур в курятнике Итог — работающий бот, распознающий кур в курятнике Читать дальше →

Как стать специалистом по Data science: итоги открытого семинара в Университете ИТМО

16 мая в Университете ИТМО состоялся семинар, посвященный теме машинного обучения. Приглашенный лектор, заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрей Созыкин, рассказывал о профессии специалиста по Data science и направлениях развития этой сферы в ближайшем будущем.

RStudio Connect — «фейслифтинг» Shiny для корпоративного применения

Прошло достаточно времени с упоминания в предыдущей публикации об использовании RStudio Connect в боевых условиях для того, чтобы поделиться результатами. Краткое резюме — «дайте два!». И подумайте про оптимизацию отдела «аналитиков».

RStudio Connect — Shiny «фейслифтинг» для бизнеса

Прошло достаточно времени с упоминания в предыдущей публикации об использовании RStudio Connect в боевых условиях для того, чтобы поделиться результатами. Краткое резюме — «дайте два!». И подумайте про оптимизацию отдела «аналитиков».

Тонкости R. Как минута час экономит

Довольно часто enterprise задачи по обработке данных затрагивают данные, сопровождаемые временной меткой. В R такие метки, обычно хранятся как класс POSIXct. Выбор методов работы с таким типом данных по принципу аналогии может привести к большому разочарованию и убеждению о крайней медлительности R.

R в enterprise задачах. Хитрости и трюки

Несмотря на то, что задачи рядового бизнеса очень часто далеки от популярной темы больших данных и машинного обучения и часто связаны с обработкой относительно малых объёмов информации [десятки мегабайт — десятки гигабайт], размазанной в произвольных представлениях по различным видам источников, применение R в качестве основного инструмента позволяет легко и элегантно автоматизировать и ускорить эти задачи.

[Из песочницы] Обзор Knime Analytics Platform — open source системы для анализа данных

О KNIME Вашему вниманию представляется обзор Knime Analytics Platform – open source фреймворка для анализа данных. Данный фреймворк позволяет реализовывать полный цикл анализа данных включающий чтение данных из различных источников, преобразование и фильтрацию, собственно анализ, визуализацию и экспорт.

Обзор рынка труда в области big data и data science

Хабр, привет! По релевантным поисковым запросам нашлось около 1000 вакансий, затем они были вручную отфильтрованы по заголовкам и описаниям, и для подготовки обзора мы использовали 288 активных вакансий в области big data и data science с HeadHunter.

DS, ML и люди, которые этим занимаются. Взгляд Сбербанка

Через банк проходят сотни миллионов транзакций ежедневно, поэтому на серверах накапливаются большие данные: сведения о самих клиентах, паттерны их покупок, требования в целом. По сути, банки превращаются в IT-компании так, как это произошло с телеком-операторами.

Отчёт со Sberbank Data Science Day: решения, победители, интервью

В ноябре Сбербанк провел серию мероприятий по машинному обучению и искусственному интеллекту Sberbank Data Science Journey. Финальное мероприятие, Data Science Day, прошло 12-го ноября на площадке DI Telegraph. Его посетило более 1000 человек. Читать дальше

«До чего дошел прогRесс». Замена «умственного» труда механическим процессом на базе R

Каждый новый день зачастую подкидывает новые задачки. Не в смысле их радикальной новизны, а в смысле «еще одного типа задач», которые обычно встречаются в бизнес-окружении. На этот раз задача оказалась предельно простая и прагматичная, но ее решение дает далеко идущие последствия.

Еще примеры использования R для решения практических бизнес-задач

С момента прошлой публикации пришлось примеряться к ряду различных задач, связанных тем или иным образом с обработкой данных. Задачи совершенно разные, но во всех случаях инструменты R позволили элегантно и эффективно их решить.

12 кейсов по биг дате: подтвержденные примеры из индустрии, когда биг дата приносит деньги

Хабр, привет! Проанализировали кейсы по big data, в которых технологии больших данных помогли компаниям более эффективно работать с клиентами или оптимизировать внутренние процессы. Кстати, совсем скоро у нас стартует первый набор программы Big Data for Executives, цель которой подготовить руководителя или владельца бизнеса к использованию данных в своей деятельности.

Применение R для подготовки и передачи «живой» аналитики другим бизнес-подразделениям

В этой краткой заметке хочу поделиться еще одним вариантом использования R в повседневных бизнес задачах. Этот «use-case» актуален почти для всех компаний, вне зависимости от их размера. Речь идет о подготовке различных оперативных отчетов и аналитических срезов. Читать дальше →

Запрягаем R на службу бизнесу на «1-2-3»

Настоящий пост является является, фактически, резюме, подводящим итоги предыдущих «технологических» публикаций [1, 2, 3, 4, 5] и возникших дискуссий и обсуждений. Последние показали, что задач в которых применение R могло бы оказать хорошую помощь бизнесу очень и очень много.

Вам не хватает скорости R? Ищем скрытые резервы

Иногда приходится сталкиваться с убеждением, что R, будучи интерпретатором, слишком медленный для анализа задач «быстрого» бизнеса. В большинстве случаев такие тезисы поступают от аналитиков, не обладающих опытом разработки серьезного ПО, в т.

Применение R для работы с утверждением «Кто виноват? Конечно ИТ!»

Продолжение предыдущих публикаций «Инструменты DataScience как альтернатива классической интеграции ИТ систем», «Экосистема R как инструмент для автоматизации бизнес-задач» и Джентельменский набор пакетов R для автоматизации бизнес-задач.

Джентельменский набор пакетов R для автоматизации бизнес-задач

Продолжение предыдущих публикаций «Инструменты DataScience как альтернатива классической интеграции» и «Экосистема R как инструмент для автоматизации бизнес-задач». Настоящая статья является ответом на возникшие вопросы по пакетам R, которые полезны для реализации описанных подходов.

Экосистема R как инструмент для автоматизации бизнес-задач

Настоящая статья является продолжением предыдущей публикации «Инструменты DataScience как альтернатива классической интеграции». Основная цель — заострить внимание как разработчиков, так и руководителей среднего звена, на широком спектре возможностей, которые предоставляют современные инструменты из сферы Data Science за рамками классических задач статистических вычислений и модной нынче темы машинного обучения.

[Из песочницы] Инструменты Data Science как альтернатива классической интеграции

В настоящий момент уже можно считать, что страсти по Big Data и Data Science немного утихли, а ожидание чуда, как обычно, было сильно скорректировано реальностью физического мира. Самое время заняться конструктивной деятельностью.

Microsoft DevCon 2016 — компьютерное зрение, SQL Server 2016, Data Science и не только

Друзья, с удовольствием делюсь с вами анонсами сразу нескольких мастер-классов, которые ожидают участников в первый день конференции DevCon 2016! Новый формат конференции предлагает вам окунуться не просто в атмосферу технологий Microsoft, а с помощью наших экспертов затронуть самые актуальные темы разработки под Windows, использования сервисов Azure, особенностей нового выпуска SQL Server 2016 и аналитики данных.

Лучшее

Приглашаем на Moscow Data Science Meetup 25 ноября

25 ноября в московском офисе Mail. Ru Group пройдет традиционная встреча сообщества Moscow Data Science. Участники поделятся профессиональным опытом решения практических задач анализа данных и пообщаются в неформальной обстановке.

Введение в machine learning: с чего начать изучение и как применять

Машинное обучение — это математическая дисциплина, изучающая алгоритмы способные выделять знания из данных. Несмотря на то, что эта дисциплина в основном теоретическая, в жизни большинства людей она с каждым годом играет все большую и большую роль.

Актуальное

Дайджест Университета ИТМО: материалы для тех, кто хочет влиться в Data Science

Сегодня мы подготовили для вас дайджест, в котором постарались собрать самые интересные литературные источники, статьи, видеокурсы и лекции (в том числе подготовленные силами преподавателей, студентов и сотрудников Университета ИТМО), которые позволят познакомиться с Data Science.

Базовые принципы машинного обучения на примере линейной регрессии

Здравствуйте, коллеги! Это блог открытой русскоговорящей дата саентологической ложи. Нас уже легион, точнее 2500+ человек в слаке. За полтора года мы нагенерили 800к+ сообщений (ради этого слак выделил нам корпоративный аккаунт).

«Мои друзья потеряли меня из виду на 3 месяца» или как люди учатся у нас big data

Всем привет! 5 октября в New Professions Lab стартует пятый набор программы «Специалист по большим данным», которую на данный момент закончило более 200 человек. Мы уже рассказывали на Хабре (здесь и здесь), чему конкретно мы учим, с какими знаниями и навыками выходят наши выпускники, и совсем скоро напишем, что нового будет в пятой программе.