azure – Azure

Dual DSVM Setup for Cost-Effective Experimentation

It is estimated that a Data Scientist spends about 80% of her time on data preparation, and not on the model training. If your training setup is just a GPU virtual machine in the cloud - it means that you are spending 80% of its uptime in vain, because GPU is not utilized. For more cost-effective way we may want to split the work between two virtual machines, one for data preparation, and another one for actual training. This is exactly the setup I used for some time when working in Microsoft CSE, before switching to AzureML, so I will share my knowledge here. Read More ›

datascience – Machine Learning

Конкурс World & AI Data Challenge: распознавание шрифта Брайля

В феврале 2020 года команда центра цифрового развития АСИ позвала меня войти в состав экспертов международного конкурса World AI & Data Challenge. В этой заметке я немного расскажу о самом конкурсе, а также о том, как можно начать решать одну из интересных задач этого конкурса - распознавание шрифта Брайля. Read More ›

science – Science

Sliding SIR Model for Rt Estimation during COVID Pandemic

One of the main characteristics of an epidemic is the effective reproduction number (Rt), which indicates the number of people each infected individual will further infect at any given time. Being able to estimate Rt is an important task, because this number defines whether the epidemic is expected to grow (Rt>1), or will start declining (Rt<1). In this post, I suggest sliding SIR method of estimation of Rt based on fitting SIR epidemic model to the infections data in different countries. Read More ›

azure – News

How to Learn Data Science without Coding

Data Science is one of the most demanding and most popular areas of computer science. One might assume that a data scientist need to know Python and programming in general to be successful. While this might be true to a certain extent, in this post we discuss whether Data Science is possible without programming, and how to start learning if you are not a programmer. TL;DR: Microsoft and Udacity just announced a collaboration that will help you with that! Read More ›

azure – Мастер-класс

DeepPavlov: "Keras" для обработки естественного языка помогает отвечать на вопросы про COVID-2019

В такой области глубокого обучения, как обработка изображений, библиотека Keras играет ключевую роль, радикально упрощая обучение transfer learning и использование предварительно обученных моделей. В области обработки естественного языка (NLP) для решения достаточно сложных задач, таких как ответы на вопросы или классификация намерений, приходится комбинировать серию моделей. В этой статье мы расскажем, как библиотека [DeepPavlov](http://deeppavlov.ai/?utm_source=habr&utm_medium=article&utm_campaign=odqa_covid) упрощает построение цепочек моделей для NLP. На основе [DeepPavlov](http://deeppavlov.ai/?utm_source=habr&utm_medium=article&utm_campaign=odqa_covid) и с помощью Azure ML мы построим вопросно-ответную нейросеть, обученную на наборе данных COVID-19. Read More ›