bookmate game
Books
Никита Сергеев

Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев

  • Иван Прозоровцитирует3 года назад
    С каждым днем все сложнее становится провести границу между любой современной профобластью (от биологии и медицины до управления организациями и персоналом) и аналитикой. А все социально-экономические исследования практически неотделимы от сравнений выборок, корреляционного, факторного и регрессионного анализа.
  • Andrey Shornikovцитирует5 лет назад
    Есть еще, конечно, креативная отсебятина (кстати, очень часто встречаемая в менеджменте, социально-экономических и гуманиртарных направлениях). Когда человек что-то увидел, чего-то нахватался — и из этого породил в голове какую-то ерунду и, уверовав в нее, обозвал некой моделью
  • Maria Tkachevaцитирует2 года назад
    Поэтому чем бы Вы ни планировали заниматься — вероятность необходимости использования статистики и анализа данных в современном мире с каждым днем становится все ближе и ближе к 1 или 100%.
  • Анастасия Мещеряковацитирует2 года назад
    аличие связи между переменными не значит причинную обусловленность.
  • Анастасия Мещеряковацитирует2 года назад
    Например, количество пожаров в городе будет очень сильно коррелировать (иметь значимые статистические взаимосвязи) с количеством выездов пожарных машин. Но никто в здравом уме ведь не станет утверждать, что выезд пожарной машины вызывает пожар.
  • Анастасия Мещеряковацитирует2 года назад
    объектов анализа (случаев, наблюдений) — то используют непараметрические критерии (Вилкоксона, медианные и знаковые тесты). Рекомендуется проверять по нескольким непараметрическим критериям. Обычно, если по какому-то из них показывает значимые различия, то и по другим их также покажет. Но бывают нюансы: например, в ранговых критериях, когда встречается большое количество одинаковых значений — и они попадают в один ранг.
  • Анастасия Мещеряковацитирует2 года назад
    переменная измерена в интервальной шкале, нормально распределена в каждой сравниваемой группе и случаев / наблюдений / объектов много (100+) — используют параметрические критерии (Т-критерий Стьюдента).

    Если переменные имеют другие шкалы, являются «ненормально» распределёнными в любой из групп или в массиве содержится мало о
  • Анастасия Мещеряковацитирует2 года назад
    один из важнейших вопросов — какую переменную считать зависимой (т.е., на которую влияют), а какие независимыми (которые на нее влияют). И важно не перепутать причину со следствием.

    Вопрос причинности — в принципе отдельный ключевой вопрос, который надо упомянуть. Особенно он важен в социально-экономической реальности, так как здесь, в отличии от инженерно-естественных наук, больше всего процветает подмена причин и следствий.
  • Анастасия Мещеряковацитирует2 года назад
    Группы (выборки), между которыми ищут различия, бывают:

    · независимыми — когда разные объекты / наблюдения / случаи сравниваются между собой (например, мужчины и женщины; сотрудники разных отделов, избиратели из разных городов и т.д.)

    · связанными (парными, зависимыми) — когда одни и те же объекты / наблюдения / случаи сравниваются ДО и ПОСЛЕ какого-то воздействия (до и после тренинга, до и после просмотра рекламы, до и после приема лекарства и т.д.).
  • Анастасия Мещеряковацитирует2 года назад
    меня персонально свое отношение к анализу временных рядов. Как по мне, проще прогнозировать на базе концептуальных моделей и регрессии, чем искать ответы во временном ряде.

    Просто с моей т.з., временной ряд может дать только органический прогноз при условиях стабильности среды (т.е. ничего не меняется в соотношении сил на рынке — рынок на том же уровне зрелости, конкуренты с Вами ведут те же активности, нет новых конкурентов или заменителей и т.д.). Умалчивая о черных лебедях — это из Насима Талеба (кто не читал — советую почитать его книги на досуге) — явления, которые неожиданны и их спрогнозировать нереально, и которых все больше на все более узкие периоды времени появляются в современном мире
fb2epub
Перетащите файлы сюда, не более 5 за один раз