Машинное обучение — как секс в старших классах. Все говорят о нем по углам, единицы понимают, а занимается только препод. Статьи о машинном обучении делятся на два типа: это либо трёхтомники с формулами и теоремами, которые я ни разу не смог дочитать даже до середины, либо сказки об искусственном интеллекте, профессиях будущего и волшебных дата-саентистах.
(далее…)Метка: data science
В чем разница между Gini coefficient и Gini impurity
![](http://i0.wp.com/blog.gazolin-production.com/wp-content/uploads/2020/07/Trends-in-Gini-coefficient-of-family-income-in-China-and-the-United-States-Gini.png?fit=620%2C404&ssl=1)
Многие путаются в коэффициентах Джини, не понимают, что они бывают разные и для разных задач (и названия у них разные — просто в русском переводе, как всегда, многое схлопывается в один термин).
(далее…)Гибкое управление Data Science-продуктами
![Гибкое управление Data Science-продуктами](http://i0.wp.com/blog.gazolin-production.com/wp-content/uploads/2020/04/i_np-riffkoo1pyc9-vzhilbrjy.png?fit=620%2C463&ssl=1)
Однажды в ScrumTrek за помощью обратилась компания с data science-продуктами. Казалось бы, работа понятна и схема отработана: рассказать, что такое Agile, собрать бэклог, запустить спринт — 3 дня работы. 3, не 3, но через 3 месяца точно что-то начнет получаться, а через 3 года вообще все будет отлично.
(далее…)Аналитикам: большая шпаргалка по Pandas
![Большая шпаргалка по Pandas](http://i0.wp.com/blog.gazolin-production.com/wp-content/uploads/2020/04/data_science_1.jpg?fit=620%2C284&ssl=1)
Привет. Я задумывал эту заметку для студентов курса, на котором мы учим маркетологов автоматизировать свою работу с помощью программирования, но решил поделиться шпаргалкой по Pandas со всеми. Я ожидаю, что читатель умеет писать код на Python хотя бы на минимальном уровне, знает, что такое списки, словари, циклы и функции.
(далее…)