Home

Advertisement

Точки-в-хаосе - Кривая вывезет [entries|archive|friends|userinfo]
Hurdy-gurdy

[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Кривая вывезет [Apr. 18th, 2009|02:38 am]
Previous Entry Add to Memories Tell a Friend Next Entry
[Tags|, ]

График

Пульс блогосферы за год по запросам инфляция, девальвация и дефлорация


С соотношением инфляции и девальвации все понятно: еще полгода назад человек-с-улицы думать не думал ни о какой девальвации. А потом она его, который с улицы, достала и даже инфляцию затмила. А потом инфляция свое отыграла. Но вот откуда в России эти безумные всплески интереса к дефлорации?! Загадочная, загадочная русская душа.
LinkReply

Comments:
[User Picture]From: [info]i_crust
2009-04-18 06:38 am (UTC)

(Link)

в одном отличном аналитическом разборе всплески к словам типа дефлорация, аборт, и.т.п. очень хорошо разбирались.
происхождение этих всплесков на 99% искусственное
[User Picture]From: [info]bob_gapon
2009-04-18 01:09 pm (UTC)

(Link)

Что значит - искусственное? Если можно, чуть подробнее. Или, может, ссылочка на упомянутый обзор завалялась?
[User Picture]From: [info]i_crust
2009-04-18 01:15 pm (UTC)

(Link)

http://liveuser.livejournal.com/73187.html#cutid1
Да пожалуйста.
Автор, без преувеличения, очень хорошо понимает, о чем пишет.
Я его знаю лично и давно.
[User Picture]From: [info]bob_gapon
2009-04-18 02:57 pm (UTC)

(Link)

Спасибо. Обязательно прочту, и внимательно.
[User Picture]From: [info]i_crust
2009-04-18 03:23 pm (UTC)

(Link)

Угу. Денис любит излагать свысока, но стоит прочитать.
[User Picture]From: [info]bob_gapon
2009-04-19 02:00 am (UTC)

(Link)

Осилил текст, не без труда. Из текста ясно, что определенные пики стимулируются искусственно. Вместе с тем, общеизвестно, что всплески поисковых запросов вызывают информационные поводы. От реальных событий до того, что в конкретный день шло по ТВ. В текстике сказано, например, про День борьбы со СПИДом 1 декабря и соответствующий скачок запросов. Как отличить первую ситуацию от второй? Только тщательным анализом всех параметров, которые выдает Яндекс. Без этого сказать, что всплеск искусственный, нельзя. А от доказать, что он естественный, можно опираясь на обычные аналитические механизмы. Попытка революции в Молдове - и всплеск запросов с этим словом.
Ясно только, что в этом контексте искусственность всплесков - это не 99% и, думаю, даже не 70...
[User Picture]From: [info]i_crust
2009-04-19 04:58 am (UTC)

(Link)

а у естественных всплесков без труда находятся естественные причины:)
[User Picture]From: [info]i_crust
2009-04-19 04:58 am (UTC)

(Link)

P.S. а цифра 99 относилась к дефлорации, а не к всплескам ВООБЩЕ.
[User Picture]From: [info]bob_gapon
2009-04-19 03:16 pm (UTC)

(Link)

Понятно. Вообще, вычислить инфоповод для всплеска интереса к дефлорации очень сложно...
[User Picture]From: [info]liveuser
2009-04-20 10:13 am (UTC)

(Link)

> происхождение этих всплесков на 99% искусственное

Понятно, что не солнышком пригрело :-) Но пока не знаем, откуда именно такой пик, говорить не о чем. (В общем, там вся запись была про то, что сначала соберите данные, посмотрите, что да как, поймите, что они означают, а потом делайте выводы). В случае с "Пульсом" данные сами на тарелочке падают, грех их не собрать.

Еще полезно знать, что цифра вообще означает - в данном случае это количество упоминаний этого слова в записях (под вопросом - и комментариев) в блогах, индексируемых Яндексом, деленное на общее количество записей в тот день.

Скажем, первый пик пришелся на 3 августа 2008 - 10 августа 2008. Вводим этот период в пульс, чтобы найти конкретную дату - получаем, что весь интерес пришелся на один день - 9 августа.

При наведении на пик - нам кажут ссылку: 09.08.2008 — 10.08.2008 по запросу дефлорация.

Только эту ссылку мы слегка отредактируем. В конце нужно дописать &rd=0, чтобы показались все записи, включая похожие с точки зрения Яндекса, потому что при построении Пульса они учитываются.

И теперь тупо смотрим выдачу.

Вот по тому, что я вижу - это какой-то уже забаненный мудила автоматом запостил в полторы тысячи коммьюнити опрос с вопросами типа "Сколько Вам лет?", "Любите ли вы веселиться на ночной вечеринке?"... Ну и в конце - "у женщин это называется дефлорацией, а как у мужчин?", "причем тут дефлорация? опрос дурацкий".

Исключаем сообщения этого мудака, добавив к запросу ~~ "опрос дурацкий", получаем 14 сообщений за 2 дня, в рамках нормы. Т.е. весь первый всплеск объясняется запощенным автоматом опросом одного мудака.

Разбор второго всплеска оставляю в качестве домашнего задания :-)
[User Picture]From: [info]bob_gapon
2009-04-20 10:48 am (UTC)

(Link)

Большое спасибо за тонкую и тщательную проработку вопроса. Теперь все вроде бы ясно. Но меня мучает один вопрос - а зачем эти мудаки делают безумное количество автоматических запросов на слова "аборт" или "дефлорация"? Я имею некоторое отношение к гуманитарным наукам, и этот феномен не укладывается ни в какие из известных мне аберраций индивидуального или массового сознания. В чем смысл? Это что, такое самоутверждение?
[User Picture]From: [info]liveuser
2009-04-20 10:57 am (UTC)

(Link)

В случае с "абортом" - конкретно он никому не нужен был. Тогда искали форумы по куче тем, количество разных запросов исчислялось десятками тысяч, и "аборт" в их числе либо просто не отфильтровали, либо отнесли к медицинской тематике.

С "дефлорацией" - запощенный опрос был посвящен вечеринкам (можно его целиком в кэше посмотреть), а "дефлорация" там просто в конце затесалась, в порядке шутки.
[User Picture]From: [info]bob_gapon
2009-04-20 06:02 pm (UTC)

(Link)

Спасибо за информацию, что-то я, конечно, из написанного Вами вынес, но, к сожалению, меньше, чем хотелось бы. Материя для меня сложная. Но одно очевидно - к пульсу блогосферы теперь буду относиться с бо-ольшим подозрением...
[User Picture]From: [info]liveuser
2009-04-20 10:47 am (UTC)

(Link)

Пара апдейтов:
1. Пик пришелся, конечно, на два дня, 9-10 августа. Это я зачем-то воспринял это как период.
2. В конце для наглядности можно построить новый пульс с запросом 'дефлорация ~~ "опрос дурацкий"'.
3. То, что Яндекс не исключает при построении Пульса похожие записи, - глупость полная.
4. Графики, в которых изначально точечные данные соединены "для наглядности" линиями этими, - мудачество, только затрудняющее понимание. Детишкам понятнее, но работать с ними совершенно невозможно.
[User Picture]From: [info]bob_gapon
2009-04-20 10:52 am (UTC)

(Link)

Ну, невозможно... Вы же работаете. Сопоставляете с другими источниками информации, с данными того же Гугла. Смотрите информационный фон. Используете здравый смыл и логику такого общего рода, не связанную непосредственно с интернетом...
From: [info]ariisaid
2009-05-15 01:13 pm (UTC)

(Link)

Круто Тевтоны в наше вpемя

Advertisement