Выгрузка детальной статистики по голосованиям с мультивыбором
Вот, на ЛОРе есть голосования. Некоторые из них довольно интересны. Некоторые из этих интересных голосований позволяют выбрать несколько вариантов ответа.
Может быть, можно сделать так, чтобы пользователи могли получить точное количество голосов по каждой комбинации ответов? Это позволило бы смотреть корреляции между ними. Тогда эти результаты можно было бы применить для исследований.
Возьмём это голосование: Какой системой управления версиями вы пользуетесь? (Какой системой управления версиями вы пользуетесь?). Ведь интересно было бы узнать, сколько пользователей Git пользуются ещё и Mercurial и наоборот. Сколько пользователей SVN пользуются другими системами. Чем пользуются 2 пользователя VSS помимо VSS. Сколько пользователей, выбравших «Не пользуюсь», выбрали ещё и другой вариант ответа.
Всё это можно было бы узнать по детальной статистике. Например: "(Git) = 100 голосов, (Git, SVN) = 500 голосов, (SVN, CVS, Mercurial) = 50 голосов, (Единая Россия) = 14000 голосов.
Разумеется, статистику нужно выгружать без ников и другой личной информации голосовавших. И лучше всего в машиночитаемом формате.
в опросе 15 вариантов ответа. ваши действия?
Почему без ников? Давайте с никами! Интересно же кто и как отвечает!
в опросе 15 вариантов ответа. ваши действия?
Это, если я не ошибаюсь, 32767 возможных комбинаций. Не так уж много.
Чего вы боитесь? Чрезмерных затрат серверных ресурсов? Так ведь у нас и так для каждого пользователя сохраняется его выбор по каждому голосованию в БД, раз он показывается самому пользователю. Надо всего лишь их суммировать и выдавать в машиночитаемом виде по запросу.
могу на пробу выгрузить результат какого-нибудь голосования
Можно выбрать вот этот, он, наверное, будет интересен многим: Как вы участвуете в жизни любимого дистрибутива?
Интересно будет, как ответили те, кто выбрал что-то кроме «не делаю ничего».
Ой, прошу прощения, что не заметил это сообщение вовремя. Большое спасибо. Сейчас посмотрим, что можно узнать.
И выбранные пользователем варианты ответа насильно заносить в комментарий о нём.
Итак, благодарю за выгрузку. Действительно, из детальных данных можно узнать многое, что трудно понять только по количеству голосов за каждый пункт.
Напомню список вариантов:
В начале несколько замечаний по самому опросу:
- Очень многие (ну, очень многие из тех, кто выбрал что-то кроме «ничего») указали, что участвуют в тестировании. Интересно, что они под этим подразумевают. Вполне вероятно, что «писали багрепорты». Интересно было бы провести опрос о том, кто занимается триажем багов в дистрибутивах.
- Также очень многие выбрали пункт «пишу статьи, отвечаю на вопросы пользователей». В самом деле, под него подходит любой пользователь ЛОРа, кроме вендотроллей.
- Некоторые пункты естественным образом коррелируют. Например, если человек — владелец русскоязычного сайта, то он, очевидно, пишет и статьи.
Вот какие интересные факты в целом удалось выяснить:
- Один человек выбрал все варианты (включая «Ничего из перечисленного»). Я его в дальнейшем не учитывал.
- Из выбравших вариант «Ничего из перечисленного» 18 человек выбрали ещё и другие варианты.
- Правда ли, что арт в опенсорсе рисуют программисты? Оказалось, нет. Множества проголосовавших художников и членов команды разработчиков не пересекаются.
- Только 40% разработчиков участвуют в тестировании дистрибутива. Это многое объясняет. (Шутка, конечно. Полагаю, разработчики сомневались, участвуют ли они в тестировании, если тестируют только свои программы).
- Жертвуют ли деньги на дистр те, кто над ним работает? Только 4% владельцев русскоязычных сайтов (1 человек), 5% разработчиков, 13% художников и переводчиков.
- Кстати о владельцах русскоязычных сайтов. Всего их 26. Только 2 состоят в команде разработчиков, 1 занимается артом и 1 шлёт деньги. Но только 2 не выбрало никаких других вариантов. 20 пишут статьи и отвечают на вопросы пользователей (остальные 6, видимо, почивают на лаврах. Шучу, шучу. ), 13 участвуют в тестировании, 10 помогают с переводом и документацией.
- Если выкинуть все такие голоса, в которых не выбрано ничего кроме «Тестирование», «Пишу статьи» и «Ничего из перечисленного», останется всего 235 человек. 9 из них почему-то отметили вариант «Ничего из перечисленного». Они, наверное, думают, что недостаточно трудятся во славу любимого дистра. И вот, голоса этих 235 человек распределяются более ровно, хотя художников и владельцев русскоязычных сайтов было и остается мало:
- Либо каждый пользователь, занявшийся разработкой дистрибутива, постепенно втягивается во все сферы деятельности.
- Либо просто активные разработчики дистрибутива не считают тестирование, документирование и перевод, а также статьи и консультации каким-то особым видом работы, а думают, что так или иначе они все этим занимаются. Впрочем, из «команды разработчиков» 40% не отметили никаких других вариантов.
Вот такие выводы. Я, конечно, не специалист по статистике, но, по-моему, это довольно весело.