@Lex Publica
Достаточно поглядеть на то, чем различается DA vs DS, пристально на список кометенций и скилзов. #^https://www.coursera.org/articles/data-analyst-vs-data-scientist-whats-the-difference
Если же более детально, то врёт текст по твоей ссылке почти в каждом абзаце.
Сложно представить себе гуманитария, который вдруг разбирается в статистике как дисциплине математической и знаком с корреляционный и регрессионным анализом (предикативным).
При этом освоил работу с SQL не просто так, а в разрезе Data Base Aplication (DBA), поскольку должен выполнять ETL-задачи посредством специальных инструментов, но предварительно прежде чем их натравит должен сам поковыряться в базах для понимания чего именно должны сделать для него инструменты для извлечения (extraction), преобразования (transformation) и загрузки данных (load) в плане ETL.
Т.е. огромный пласт работы у DA & DS вокруг извлечения данных, очистки их и оценки качества (с точки зрения валидности по статистике). Только после этого идёт уже попытка анализа теми или иными подходами с использованием библиотек python и реализаций на R.
Так же надо уметь работать ну хоть с какой-то business intelligence (BI) системой или платформой, поскольку проверка гипотез — это прекрасно, но ведь надо и модели создать в таком виде, в котором они должны работать для пользователей — в рамках витрин данных, даш-боардов и различных отчётов.
Не говоря уже о том, что надо уметь в ещё полдюжины вещей, чтобы нормально работать по этой профессии.
Достаточно поглядеть на то, чем различается DA vs DS, пристально на список кометенций и скилзов. #^https://www.coursera.org/articles/data-analyst-vs-data-scientist-whats-the-difference
Если же более детально, то врёт текст по твоей ссылке почти в каждом абзаце.
Сложно представить себе гуманитария, который вдруг разбирается в статистике как дисциплине математической и знаком с корреляционный и регрессионным анализом (предикативным).
При этом освоил работу с SQL не просто так, а в разрезе Data Base Aplication (DBA), поскольку должен выполнять ETL-задачи посредством специальных инструментов, но предварительно прежде чем их натравит должен сам поковыряться в базах для понимания чего именно должны сделать для него инструменты для извлечения (extraction), преобразования (transformation) и загрузки данных (load) в плане ETL.
Т.е. огромный пласт работы у DA & DS вокруг извлечения данных, очистки их и оценки качества (с точки зрения валидности по статистике). Только после этого идёт уже попытка анализа теми или иными подходами с использованием библиотек python и реализаций на R.
Так же надо уметь работать ну хоть с какой-то business intelligence (BI) системой или платформой, поскольку проверка гипотез — это прекрасно, но ведь надо и модели создать в таком виде, в котором они должны работать для пользователей — в рамках витрин данных, даш-боардов и различных отчётов.
Не говоря уже о том, что надо уметь в ещё полдюжины вещей, чтобы нормально работать по этой профессии.