Главная » 2015 » Январь » 16 » Доклад
11:38
Доклад
Наше исследование на тему параметров популярности кинофильмов, начало которого можно увидеть здесьhttp://shu30.livejournal.com/99835.htmlhttp://kinoseminar.livejournal.com/360625.htmlhttp://kinoseminar.livejournal.com/362264.htmlбыло представлено на V Овсянниковской эстетической конференции.Приводим текст доклада с незначительными сокращениями.Алексеев А.Ю., Нестеров И.А.«Классичность» и «современность» как факторы популярности кинофильмов            Традиция эмпирического исследования в области эстетики, основанного на количественном описании произведений искусства и других эстетических объектов, а также их восприятия зрителем, заложенная еще в XIX веке Г.Т. Фехнером [1], в настоящее время продолжает активно и плодотворно развиваться [2]. Наличие интернет-проекций сферы искусства значительно упрощает проведение количественных измерений некоторых аспектов восприятия художественных произведений, прежде всего, связанных с их популярностью и субъективной оценкой. В частности, практически готовый статистический материал можно получить, рассматривая такое распространенное явление, как кинорейтинги. Кроме того, для полноты картины, в рассмотрение можно включить и другие аспекты популярности, количественную информацию о которых также можно собрать в сети.        Авторами данной работы для анализа был выбран рейтинг сайта Кинопоиск (kinopoisk.ru), который пользуется большой популярностью, однако, в отличие от наиболее известного сайта imdb.com, предоставляет величину рейтинга с точностью до третьего (а не второго) знака. Были взяты данные для 250 фильмов, занимающих наивысшие позиции в рейтинге (топ-250). Набор данных для каждого фильма включал саму величину рейтинга (которая вычисляется на основе голосования пользователей сайта, выставляющих оценку фильму по десятибалльной шкале), число голосов отданных за фильм, год выхода фильма, кассовые сборы, а так же рейтинг фильма по оценкам кинокритиков (эти данные на Кинопоиске взяты с сайта rottentomatoes.com). Чтобы повысить однородность материала, из рассмотрения были исключены фильмы отечественного производства, а также фильмы, составляющие серии, в итоге осталось 188 фильмов.      Рис. 1. Распределение рейтинг по оценкам зрителей / рейтинг по оценкам кинокритиков.            На рис. 1 показано, как соотносятся между собой рейтинг оценок зрителей, голосующих на сайте Кинопоиск, и рейтинг кинокритиков, собранный сайтом rottentomatoes.com. Здесь и далее каждая точка на рисунке представляет фильм. Четкого соответствия между этими двумя параметрами не наблюдается. Коэффициент корреляций между ними (см. табл. 1) равен 0.126, корреляция положительна и статистически значима, но невелика, нельзя утверждать, что существует какой-либо единственный фактор, в основном определяющий и оценку зрителей, и оценку критиков. Для более подробного изучения этих оценок мы отдельно рассмотрели, как тот и другой рейтинг ведут себя в зависимости от года производства фильма (рис. 2 и 3). Кривые показывают сглаженное среднее значение в зависимости от года.            Разброс значений обоих рейтингов значительно увеличивается, начиная с 80-х годов. При этом среднее значение рейтинга кинокритиков плавно уменьшается с увеличением года производства фильма, а среднее значение рейтинга зрителей, напротив, несколько возрастает в районе 90-х. По рис. 2-3 наглядно видно, что тенденции в изменении рейтингов прямо противоположные. Однако (рис. 1), это не приводит к отрицательной корреляции в целом, что означает, что помимо этих тенденций, значения кинорейтингов определяются и другими существенными причинами. Рис. 2. Рейтинг по оценкам кинокритиков.                              Рис. 3. Рейтинг по оценкам зрителей. Рис. 4. Количество скачиваний с торрентов.                            Рис. 5. Мировые кассовые сборы.            Для дальнейшего анализа мы обратились к другому источнику информации — торрент-трекерам — сайтам файлообмена, приобретшим в последние годы большую популярность. Эти сайты содержат широчайший набор фильмов, начиная от зари кинематографа и до наших дней. Число скачиваний фильма является хорошим индикатором зрительского интереса к нему. Нами были сняты данные по количеству скачиваний с наиболее популярного русскоязычного торрент-трекера rutracker.org (по всем раздачам фильма) для рассматриваемого набора 188 фильмов из топ-250 по рейтингу Кинопоиска. На рис. 4 показана зависимость количества скачиваний фильмов от года их выхода. Также были рассмотрены данные по кассовым сборам (для тех фильмов, для которых известна полная сумма по мировому прокату) — рис. 5. И в том и в другом случае наблюдается укоряющийся рост (за исключением последнего, 2011, года, что, очевидно, объясняется тем, что как прокат, так и скачивание с торрентов для фильмов этого года еще активно продолжалось на момент проведения исследования).В итоге были использованы следующие индикаторы популярности фильмов:Рейтинг по оценкам кинокритиков с сайта rottentomatoes.com.Рейтинг по оценкам зрителей с сайта kinopoisk.ru.Количество голосов зрителей на сайте kinopoisk.ru.Количество скачиваний с торрентов rutracker.org.Количество раздач фильма на rutracker.org.Кассовые сборы по всему миру.Год производства фильма.Все данные снимались на момент февраля 2012 года.            Как эти данные связаны между собой? Количественно связь между числом скачиваний и рейтингами можно оценить с помощью коэффициентов корреляции, представленных в таблице 1. Жирным шрифтом выделены корреляции, статистически значимо отличающиеся от нуля.Таблица 1. Коэффициенты корреляцииРейтинг критиковРейтинг кинопоискаКол-во голосов на кинопоискеЧисло скачиваний с торрентаЧисло раздач на торрентеКассовые сборыГодРейтинг критиков10.126-0.067-0.004-0.0260.105-0.402Рейтинг кинопоиска0.12610.6720.3840.4450.1730.069Кол-во голосов на кинопоиске-0.0670.67210.7770.7430.5540.357Число скачиваний с торрента-0.0040.3840.77710.6760.6540.358Число раздач на торренте-0.0260.4450.7430.67610.4580.249Кассовые сборы0.1050.1730.5540.6540.45810.192Год-0.4020.0690.3570.3580.2490.1921            Из таблицы видно, что все рассмотренные индикаторы популярности фильмов существенно коррелируют между собой. Исключение составляет рейтинг кинокритиков: он слабо, но значимо коррелирует с рейтингом зрителей, достаточно сильно антикоррелирует с годом производства фильма, и весьма слабо — со всеми остальными индикаторами популярности.            Дальнейшее рассмотрение проводилось на основе факторного анализа. Факторный анализ (ФА) — широко распространенное средство анализа многомерных данных, создающее предпосылки для их содержательной интерпретации ([3], гл. 6). Его основная идея заключается в поиске независимых (некоррелированных) скрытых параметров (факторов), действием которых можно объяснить существенную часть вариаций экспериментальных данных. Нами было использовано одно из наиболее популярных средств ФА — метод главных компонент (МГК), как не требующий предположения о нормальности распределения переменных ([4], гл. 9). Рассматривались фильмы из вышеописанной выборки, для которых были известны все семь параметров популярности (таких фильмов было 160). Все параметры популярности были нормированы так, чтобы их выборочная дисперсия равнялась 1 (т.е. ковариационная матрица совпадала с корреляционной). Собственные значения ковариационной матрицы показаны на рис. 6.   Рис. 6. Собственные значения ковариационной матрицы для индикаторов популярности..Таблица 2. Матрица нагрузок.Номерфактора1234567Рейтинг критиков-0.2560.8260.2760.3270.2540.0370.058Рейтинг Кинопоиска0.5780.439-0.6380.195-0.1240.101-0.051Кол-во голосов на кинопоиске0.9280.1230.089-0.1230.034-0.2150.232Число скачиваний с торрента0.9120.0960.095-0.0720.260-0.166-0.224Число раздач на торренте0.8310.1680.214-0.3820.0250.2960.027Кассовые сборы0.744-0.0330.3790.342-0.429-0.018-0.026Годпроизводства0.544-0.660-0.0460.3920.3070.1260.057            Из рис. 6. видно, что первый фактор будет определять основную часть разброса значений индикаторов популярности (около 50% дисперсии данных). Для остальных факторов их вклад существенно меньше и плавно спадает с ростом номера. Таким образом, количество включаемых в рассмотрение факторов будет определяться дополнительными соображениями точности описания значений всей совокупности индикаторов популярности, либо специально выбранного для рассмотрения выделенного индикатора. Так, например, три первых фактора будут описывать 80% совокупной дисперсии данных.            Матрица нагрузок для всех факторов представлена в таблице 2. (Нагрузка переменной на фактор показывает, какой вклад в значение переменной вносит данный фактор.)            Перейдем к содержательной интерпретации трех первых факторов. Помимо того, что, как было упомянуто выше, три фактора описывают 80% дисперсии всех данных, при выборе их количества мы руководствовались тем, что именно три первых фактора описывают 93% дисперсии наиболее важной для рассмотрения переменной — зрительского рейтинга сайта Кинопоиск.            Первый фактор. Дает максимальный положительный вклад в переменные «Количество голосов зрителей» (0.928), «Число скачиваний с торрента» (0.912), «Число раздач на торренте» (0.831) и «Кассовые сборы» (0.744), описывая большую часть их дисперсии. Кроме того, он дает весьма существенный положительный вклад в переменные «Рейтинг Кинопоиска» (0.578) и «Год производства фильма» (0.544). Это основной фактор популярности, определяющий, в первую очередь, поведение зрителей (активность голосования, поход в кинотеатры, размещение и скачивание на торрентах). Также он положительно влияет на оценку фильма зрителями, но уже в ряду других факторов. В оценку критиков он вносит небольшой, но, что интересно, отрицательный вклад. Вкупе с тем, что этот фактор положительно связан с годом производства, это приводит к предположению, что он отражает механизмы «моды» как коллективного поведения, сопряженного с культом «современности», порождающим соответствующие оценки. Критики же, как держатели культурной традиции, реагируют на «моду» слабо и в целом отрицательно. Итак, первый фактор мы интерпретируем как «модность» или «современность» фильма.            Второй фактор. Дает существенный вклад в три переменные: «Рейтинг критиков» (0.826) — т.е. это самый главный фактор для критиков, «Рейтинг Кинопоиска» (0.439) — существенный положительный вклад в зрительскую оценку, хотя и меньший, чем первый фактор «моды», и, наконец, «Год производства фильма» (-0.66) — наиболее сильная отрицательная связь с годом. Учитывая рис. 2, можно предположить, что это фактор «классичности», включенности в культурную традицию, соответствия сложившимся нормам. Здесь обращает на себя внимание то, что как «современность», так и «классичность» — оба этих фактора положительно (и независимо — точнее говоря, некоррелировано) влияют на оценку фильма зрителями. Т.е. нет оппозиции «прошлое–настоящее» как противоположностей, вместо этого «классичность» и «современность» проявляются как независимые факторы.            Третий фактор. Дает отрицательный вклад в «Рейтинг Кинопоиска» (-0.638) и положительный вклад в «Кассовые сборы» (0.379) и «Рейтинг критиков» (0.276). Практически не связан с такими параметрами как «Число скачиваний с торрента», «Количество голосов зрителей» (т.е. актуальной популярностью) и «Год производства фильма» (т.е. это вне-временной фактор). Можно предположить, что он выражает разочарование зрителей от просмотров в кинотеатрах и рецензий критиков, т.е. является реакцией на «недобросовестную рекламу».            Обратим внимание на следующее. Если первый фактор («современность») практически полностью описывает индикаторы, относящиеся к «потребительскому» поведению зрителя (просмотр в кинотеатрах, скачивание с торрентов, голосование), а второй фактор («классичность»), опять же, почти полностью предопределяет оценку критиков, то оценка фильма зрителями ведет себя иначе — для ее описания необходимо ввести в рассмотрение три различных рядоположенных фактора (дающих почти одинаковый вклад в оценку). Еще раз подчеркнем, что «классичность» (соответствие устоявшимся, признанным культурным нормам) и «современность» (соответствие текущему моменту, текущему культурному контексту, в котором находится зритель) не образуют бинарной оппозиции, а являются отдельными, независимыми источниками зрительской оценки фильма.Список литературы1.Фехнер Г.Т. Из книги "Введение в эстетику" // Семиотика и искусствометрия. Современные зарубежные исследования. — М.: Мир, 1972. С. 326-329.2. Петров В.М. Количественные методы в искусствознании.— М.: Академический проект; Фонд "Мир", 2004.3. Гусев А.Н., Уточкин И.С.  Психологические измерения: Теория. Методы. — М.: Аспект-Пресс, 2011.4. Ивченко Г.И., Медведев Ю.И.  Введение в математическую статистику. — М.: Изд-во ЛКИ, 2010.P.S. Это было "разведочное" исследование. В дальнейшем мы хотим охватить больший объем материала. В связи с этим вопрос: какие данные по вашему мнению стоит включить в рассмотрение (другие рейтинги, оценки критиков и т.д.)? 
Просмотров: 144 | Добавил: admin | Рейтинг: 0.0/0
Всего комментариев: 0
avatar