Главная

Факторный анализ — что это такое простыми словами

Содержание

Кратко и простыми словами расскажем, что такое факторный анализ, и рассмотрим его основные задачи. На самом деле, вы часто используете его в жизни. Неосознанно. Выбирая фильм на вечер, вы оцениваете несколько важных аспектов: жанр, длительность, настроение, актеров и отзывы. При покупке смартфона учитываете его производительность, дизайн, цену, характеристики камеры и обзоры блогеров. Интуитивно группируете это в категории, которые наиболее значимы для вас, например, рейтинг и стоимость Каждый из критериев помогает сузить выбор и сделать его более осознанным. О том, как подобные рассуждения выглядят на уровне бизнеса, мы и поговорим в статье.

Определение

Итак, что собой представляет факторный анализ — это метод, который позволяет уменьшить количество переменных в данных: выделить ключевые признаки, которые объясняют большинство изменений в этих характеристиках.

 

Предположим, у вас есть анкета, в которой люди оценивают свои привычки по следующим параметрам:

  • частота употребления овощей;
  • время, проведенное на свежем воздухе;
  • частота посещения спортзала;
  • качество сна. 

Эти данные могут быть связаны с неким скрытым критерием, например, уровнем здоровья. Анализ поможет вам выделить этот «фактор» (уровень здоровья), который влияет на все перечисленные оценки, несмотря на то, что сам по себе он не измеряется напрямую.

В чем польза

Как и для чего нужен факторный анализ бизнесу:

 

  • раскрывает взаимосвязь между различными показателями, которые не всегда заметны сразу;
  • предполагает, что множество признаков можно объяснить через несколько более простых и менее очевидных элементов, которые влияют на них.
  • позволяет упростить пул информации, выделяя несколько ключевых аспектов, которые легче проанализировать и понять.

Метод используют маркетологи, социологи, психологи, экономисты, HR-специалисты, медицинские исследователи, финансисты и аналитики данных. В сущности, factor analysis показывает как различные характеристики взаимосвязаны и какие неочевидные элементы могут объяснять их поведение или изменения. Это помогает упростить сложную статистику, найти ключевые закономерности, принимать решения точнее — экономить время и ресурсы.

Если вы хотите узнать, какую еще пользу можно получить из данных и как превратить это в востребованную профессию, приходите учиться на аналитика на реальных задачах бизнеса.

Алгоритм проведения

1. Выявить, какой фактор и зачем нужно проанализировать.

Это может быть то, что вы хотите улучшить или понять. Например, уровень удовлетворенности клиентов или производительность сотрудников.

2. Определить, что влияет на выбранный показатель.

Здесь бывают явные аспекты и менее очевидные. Например, на удовлетворенность пользователей влияет качество обслуживания, стоимость товара, внешний вид магазина и удобство расположения.

3. Рассчитать каждый из аспектов и оценить эффект.

Для этого применяют математические методы, которые показывают, насколько каждая причина связана с конечным эффектом. Например, вы используете программу для анализа данных и вычисляете, что наибольшее влияние оказывают уровень сервиса и прайс, а интерьер и расположение магазина не особо важны.

4. Изложить практические заключения и стратегию дальнейших действий.

Вы должны понять, какие действия помогут улучшить ситуацию. В примере с магазином выводы подсказывают, что нужно повысить рабочие стандарты и пересмотреть ценовую политику, а дизайн витрины не трогать: он особо ни на что не влияет.

 

Чтобы процесс выявления значимых закономерностей был максимально эффективным, важно четко обозначить этапы, задачи и способы факторного анализа. Покажем на примерах далее в статье.

Откуда брать данные

Обычно сведения собираются из разных источников. Выбор зависит от того, что именно вы хотите исследовать

  • Интернет

В последние годы большое внимание уделяют информации из социальных сетей, интернет-платформ и блогов. Например, иногда посты и комментарии подсвечивают скрытые критерии, влияющие на популярность определенных тем или продуктов.

  • Датасеты 

Существует множество открытых баз, таких как Портал государственных закупок, материалы на сайте Минпросвещения России, платформа KNOEMA.

  • Опросы и анкеты

Один из самых простых способов узнать предпочтения или личные качества людей. Например, можно провести интервьюирование среди пользователей интернет-магазина, чтобы понять, что влияет на их покупательское поведение (цена, качество, удобство, реклама). Это надежная основа для факторов анализа.

  • Исторические данные

Их собирают в маркетинге, финансах и других областях. Это как отчеты о выручке в магазине: если регулярно фиксировать, сколько товаров продано в разные дни, можно заметить, что в выходные продажи выше, а в будни — ниже.

 

Представим, вы хотите понять, что влияет на покупку керамических горшков для растений на маркетплейсе. Собираете информацию о возрасте покупателей, частоте покупок, отзывах о товаре и его цене. После этого анализируете и выделяете такие аспекты, как «ценовая чувствительность» и «качество продукта», в совокупности объясняющие поведение покупателей.

Виды и методика факторного анализа

Стохастический метод

 

Вид исследования, основанный на вероятностных моделях. Здесь предполагается, что элементы системы подчиняются законам вероятности, и мы стремимся выявить скрытые закономерности, оценивая их распределение. Если у нас есть информация о поведении людей, мы предполагаем, что различные обстоятельства (например, личные предпочтения) влияют на их действия с определенными шансами. Стохастический анализ помогает обнаружить эти закономерности, учитывая случайные колебания в наблюдаемых характеристиках.

Детерминированный

В отличие от первого типа, этот предполагает, что все изменения в показателях могут быть точно объяснены неочевидными причинами, без учета случайных колебаний. То есть все результаты определены точно, например, если мы знаем, что конкретный фактор всегда влияет на данные определенным образом, и не предполагаем случайных отклонений.

Метод абсолютных разниц

Этот способ помогает найти скрытые характеристики, которые влияют на то, что мы видим. Он используется, когда важно учитывать, насколько сильно наблюдаемые значения отличаются от предсказанных, без учета того, в какую сторону эти различия идут. Например, метод абсолютных разниц помогает минимизировать отклонения между реальными и прогнозируемыми значениями. Это особенно полезно, когда точность измерений важнее, чем то, как именно происходят изменения.

Таким образом, виды ФА определяют, как мы воспринимаем данные (со случайностью или без), способы описывают конкретные техники выделения критериев, а методы — это математические алгоритмы, которые применяются для вычислений.

Пример

Представьте, что вы работаете аналитиком в компании, которая продает мебель, и изучаете ежемесячные отчеты о продажах. Цель факторного анализа предприятия заключается в выявлении и интерпретации этих сведений, чтобы понимать, что воздействует на рост или снижение выручки. Стохастический вид ФА поможет вам выделить скрытые причины, такие как сезонность (летом продажи выше), маркетинговые кампании (успешная рекламная акция увеличивает продажи) и изменения в ценах на материалы.

Применяя метод абсолютных разниц, вы можете сравнить фактические продажи с теми, которые предсказывает ваша модель на основе этих факторов, и оценить, насколько точно она отражает реальность. Если разница большая, возможно, не были учтены дополнительные обстоятельства.

Как провести факторный анализ

От того, насколько качественно собраны данные и как их интерпретировали, зависят конечные выводы. А от их правильности — успех всего бизнеса. Разбираем метод по шагам.

Шаг 1. Определить проблему

Вы должны понимать, что хотите найти. Предположим, онлайн-кинотеатр хочет понять, что влияет на выбор фильма пользователями. Нужно выявить внутренние стимулы, которые определяют, какое кино смотрят и какие рекомендации предложить, чтобы улучшить пользовательский опыт.

Шаг 2. Собрать информацию

Что поможет составить полное представление о поведении пользователей? Пригодится всё: возраст, пол, предпочитаемые жанры, средняя продолжительность просмотра, какой рейтинг обычно ставят, в какое время суток смотрят, как часто используют приложение.

Шаг 3. Предварительно подготовить данные

Полученные сведения часто бывают неполными, ошибочными или содержат шум. Поэтому их нужно очистить: удалить дубликаты, заполнить пропуски и преобразовать в удобный для оценки вид. Например, если не все пользователи онлайн-кинотеатра указали возраст, этот параметр можно удалить или заполнить средним значением.

Шаг 4. Выбрать модель факторного анализа

В зависимости от имеющейся информации, можно выбрать методы главных компонент (PCA) или максимального правдоподобия, чтобы найти основные паттерны. В случае с кино обнаружили:

  • «предпочтение по жанрам» — пользователи, которые чаще смотрят комедии, могут меньше интересоваться триллерами;
  • «время суток для просмотра» — те, кто чаще включают сериалы вечером более склонны к драматическим жанрам.

Шаг 5. Выполнить расчеты

Только теперь переходим непосредственно к анализу. Его делают с помощью статистических программ, таких как SPSS, R или Python с использованием библиотек, например, factor_analyzer.

Если вы запустите модель в Python для онлайн-кинотеатра, то получите набор скрытых закономерностей — комбинацию таких переменных, как предпочтения по жанрам, время просмотра и оценка фильмов.

Шаг 6. Интерпретировать результаты

Теперь разберемся, как выделенные категории связаны с бизнес-целями. Мы заметили, что пользователи, которые предпочитают триллеры или фантастику, склонны оставаться верными этим жанрам при выборе нового контента. А фактор «Качество контента» состоит в том, что те, кто часто ставит высокие оценки фильмам, ищут более качественные и известные произведения.

Шаг 7. Создать стратегию на основе выводов

Теперь можно принимать взвешенные и обоснованные решения. Например, персонализировать рекомендаций и улучшить маркетинговую стратегию.

Пример: как сделать факторный анализ

Компания планировала заработать 1440 рублей прибыли, но фактически получила 1656 рублей. Разница составила 216 рублей. Разберёмся, что повлияло на результативный исход.

Рассмотрим три фактора: цену, количество продаж и наценку.

  • Собирались выставить товар за 120 рублей, а фактически реализовали за 115 рублей, т. е. продавали дешевле.
  • Хотели сбыть 200 штук, а получилось 180 — меньше, чем рассчитывали.
  • Плановая наценка была 6%, а фактическая составила 8%. Значит, на каждой продаже зарабатывали больше, чем планировали.

Вот как это подействовало на прибыль.

  • Из-за снижения цены компания недополучила 60 рублей:

(115 − 120) × 200 × 6 

  • Продажи упали, поэтому маржа уменьшилась еще на 138 рублей:

(180 − 200) × 115 × 6

  • Но на каждой сделке компания зарабатывала на 2% больше ожидаемого. Что дало прирост на 414 рублей:

115 × 180 × 0,02

Сниженные расценки и небольшое падение товарооборота обошлись компании в 198 рублей. Зато рост наценки всё компенсировал и принёс +414 рублей. В итоге бизнес в плюсе на 216 рублей.

Подведем итоги

Мы изучили основы аналитического инструмента для выявления скрытых закономерностей в информационном пуле. Рассказали, что показывает факторный анализ, в чем его суть, а также рассмотрели основные способы его сделать на примерах. Главное, уменьшить количество переменных, выделяя несколько ключевых критериев, которые объясняют большинство изменений в данных. Это позволяет бизнесу точнее анализировать результаты и принимать более обоснованные решения, снижая затраты времени и ресурсов.

Вопрос-ответ 

Как определить количество факторов, которые следует извлечь?

Для этого можно использовать критерий Кайзера: оставлять только те переменные, чье собственное значение (eigenvalue) больше 1. Это означает, что они объясняют больше информации, чем одна отдельная переменная. Представьте, что вы анализируете предпочтения людей в напитках с 10 вопросами. После анализа два скрытых предпочтения (например, «любовь к сладким» и «холодные напитки») объясняют основные ответы. Их значения 2.5 и 1.3 больше 1, поэтому оставляете. Всё остальное исключаете.

Какие типы данных подходят для проведения факторного анализа?

Подходят такие показатели:

  • количественные — то, что можно измерить и выразить в виде чисел, например, доходы, оценки или температуры;
  • многомерные — несколько характеристик для каждого объекта, например, анкета со списком вопросов;
  • коррелированные — переменные, связанные между собой, например, зарплата и уровень образования;
  • нормального распределения — сведения, сгруппированные вокруг среднего значения.

Как этот метод помогает в сегментации рынка или клиентов?

Представьте, у вас есть разные характеристики клиентов: возраст, пол, покупательские привычки, предпочтения и так далее. Они разнообразны, поэтому их сложно обработать одновременно.

Факторный анализ помогает собрать данные в несколько более простых категорий со схожими чертами. И вы увидите, что одна группа клиентов предпочитает товары для спорта, другая — для творчества. Так вы создаете несколько «типичных» групп клиентов и адаптируете маркетинг для каждой.