Published on

February 28, 2017

Исследование данных SQL Server: Анализ результатов зарплатного опроса

Как профессионал в области данных, мне всегда интересно погрузиться в данные опросов и обнаружить интересные факты о различных отраслях. Недавно у меня появилась возможность проанализировать зарплатный опрос и исследовать некоторые интересные вопросы, связанные с средними зарплатами, образованием, сертификациями и многим другим.

Стандартизация данных

Прежде чем приступить к анализу, мне потребовалось внести некоторые изменения в исходные данные, чтобы убедиться, что они находятся в формате, позволяющем извлекать значимые выводы. Вот шаги, которые я предпринял:

  1. Стандартизировал зарплаты в долларах США на годовой основе, так как изначально они были предоставлены как годовая зарплата в долларах США и эквивалент почасовой оплаты.
  2. Разделил данные о местоположении на город, штат и страну, по возможности. Это была ручная задача, так как не было единого способа разделить данные программно.
  3. Создал бинарный фильтр для сертификаций, чтобы определить, есть ли значительная разница в зарплатах между сертифицированными и несертифицированными специалистами.

Визуализация данных

После стандартизации и фильтрации данных пришло время создать визуализации, чтобы лучше понять результаты опроса. Я начал с создания визуализаций зарплат, сначала по местоположению, а затем по отраслям. Для учета выбросов я использовал медиану вместо среднего значения в качестве меры центральной тенденции. Кроме того, я добавил насыщенность, чтобы указать уровень уверенности на основе доступных данных для каждого местоположения и отрасли.

Затем я исследовал связь между стажем работы и зарплатой, сосредоточившись на разных странах. Количество респондентов было включено в подсказку, а насыщенность использовалась в качестве индикатора уверенности.

Один интересный вывод заключался в том, что уровень образования, казалось бы, не оказывал значительного влияния на зарплату. Вопреки ожиданиям, результаты опроса показали, что опыт превосходит образование в терминах потенциала заработка. Аналогично, влияние сертификаций на зарплату было неоднозначным из-за ограниченных данных.

Улучшение будущих опросов

Оценивая анализ, я выявил несколько улучшений, которые могут улучшить будущие зарплатные опросы:

  • Увеличить количество ответов, чтобы повысить уверенность в результатах. Больший объем выборки, например, 1000 респондентов, предоставит более надежные выводы.
  • Предоставить зарплаты в местных единицах на годовой основе, с отдельными полями для числового значения и описания валюты. Это исключит возможные ошибки или путаницу при конвертации валют.
  • Собирать более конкретные данные о местоположении, включая город, штат и страну. Однако, чтобы стимулировать участие в меньших рынках, может быть полезно снизить специфичность информации о местоположении.
  • Стандартизировать классификацию отраслей, чтобы обеспечить однородную категоризацию. Это позволит легче сравнивать средние зарплаты в разных отраслях и отслеживать изменения со временем.
  • Включить размер компании в числовом значении для анализа связи между размером компании и зарплатой. Это поможет определить, действительно ли крупные компании предлагают более высокие зарплаты.

В целом, анализ данных зарплатного опроса предоставил ценные выводы о отрасли. Однако всегда есть место для улучшения сбора и анализа данных, чтобы обеспечить более точные и значимые результаты.

Надеюсь, вам понравилось это исследование данных зарплатного опроса. Как всегда, я приветствую ваши отзывы и предложения по будущим анализам. Помните, когда речь идет о данных, чем их больше, тем лучше!

Click to rate this post!
[Total: 0 Average: 0]

Let's work together

Send us a message or book free introductory meeting with us using button below.