Google Trends满足了我的好奇心

  这星期原济南市人大主任段义和炸死情妇案宣判,三名主犯两人死刑,一人无期。因为俺曾在那里上过四年学,还是比较关注的。最初汽车爆炸的时候第二天就在新浪上看到了,以为是一般的爆炸。后来济南降暴雨,到齐鲁晚报的网站上看到了段义和被罢免的消息,也没当回事。昨天才发现原来是这样一个轰动全国的刑事案件。

  网上看新闻有个好处就是有评论,以至于我每篇新闻看完都要看看评论,看评论有时挺好玩的,网友们往往一针见血,而且很幽默。有的还能从评论中找到其他信息,比如能提供当时的爆炸现场照片的网络地址等。据说是异常惨烈,然而时间已经过去快一个月,原始照片很多都被删除了,咱就在网上找吧。先找百度,后找Google。在中文Yahoo上最先看到了那个血腥的震撼照片,后来又找了N多原始现场照片。一个字,狠。炸药的力量太大了。想想两公斤TNT变成气体,而且还是高温,在瞬间体积要变化那么多倍,压力和压强真是巨大。看了那张照片之后你会觉得同情那个薄命红颜,虽然她是别人的情妇,而且是通过潜规则一步步往上升。

  百度有个特点,把别人使用过的关键词做为提示列在最后,一看就知道最近人们都搜索什么热门话题了。诸如“段义和”,“柳海平”“柳海平生前照片”“段义和二奶”“济南柳海平”等。平时只用百度的搜索功能,不曾想到查看一下热门关键字,在排行榜上一看,还真吓一跳。热门人物第一名就是段义和,第三名是柳海平,但是柳海平搜索的日爬升速度为128%。我想起了几年前看的一篇报道,据说N大搜索引擎最频繁的关键字都是sex,但是不便于公开。这搜索引擎关键字的使用频率可是不可多得的统计数字啊,里面包含了多少商机,多少社会学的统计结果,多少可以揭示事物本来面目的数据。平时Google的功能也就用搜索功能最多,偶尔用用Gmail和Google Map,今天却惊奇的发现一个Google Trends.这可真是个好东东,正满足了我的好奇心,现在咱就把好奇的结果公诸于众。为2007年8月10日晚google trends抓图,在相册Aug 11 Google Trends中。如想看高清晰大图,请在此下载我的原始抓图。http://comp.uark.edu/~qxy01/googletrends.zip 为gif图片压缩包,共27张,总共1.3M大。事先声明:纯粹是从数学、心理学、人类学和社会学角度来好奇。要是有人觉得我龌龊,可以不看。

  Google Trends的一个优点是记录了重要关键字的搜索量作为时间的函数,这就如同股指一样,可以看到变化的趋势。而且,还记录了搜索的地区分布(国家分布),城市分布,使用搜索的操作平台语言分布。这些重要的分布对从另一个角度来了解世界很有意义。

  值得一提的是,由于我国改革开放后蒸蒸日上,越来越多的搜索已经本地化,所以有相当一部分的搜索转到了百度上,有些中文关键字在Google Trends的搜索量从2004到2007年逐年下降。但这并不影响到对搜索的分析。

  以下是随机选取的一些热门关键字,中文的有:中国股市,春节,陈良宇,二奶,陈水扁,小姐,鞭炮,木子美,芙蓉姐姐,杨丽娟,还有跟性有关的三个词语及另一个重要词语。英文的有:gas price, oil price, google map, (iphone, ipod), live earth, make love, SARS, september 11, sex, (crack, keygen, serial), terrorist, wikipedia, xbox 360, PSP, clone.

  结论:
  相比于天下大事来说,人们总是更关心自己身边发生的事情;虽然就发生在身边,但是依然需要通过网络才能得到相关信息。如:陈良宇(最多的是上海和附近地区),杨丽娟(最多的是兰州),二奶(最多的是深圳,广州),段义和(最多的是济南,然后是青岛)或最临近的地区,如陈水扁(最多的是厦门、福州)

  传统性的内容总是周而复始,如春节和鞭炮,就象标准的脉冲一样在固定的时间达到峰值。

  热点性的内容往往象超新星爆发一样在很短的时间即达到峰值,然后又快速回落。但回落速度与爆发时相对较慢。如木子美,芙蓉姐姐,杨丽娟。但是基线不会为零,并且会有小的波动。

  成熟的新科技会稳步发展,其搜索量呈指数级增长。如google map, wikipedia.(注:搜索量是对数图,不是线性坐标)。

  与时效密切相关的内容:如中国股市,gas price,oil price,SARS,september 11,terrorist, 这些是突发性事件,但会在以后发生影响。

  新旧产品的更新换代,如iphone, ipod,反映了一个产品的生命周期。

  圣诞节的确是全球消费的热点,每到圣诞节的搜索量大增。如PSP, xbox 360等。

  很多前东欧社会主义国家及俄罗斯、越南盗版软件使用严重,如关键字crack, keygen, serial的搜索地区所揭示。有趣的是这三个关键字虽然振幅不同,但是波型极其相似。是同类搜索关键字。

  使用google的中国用户在与性有关的三个关键字和另一个本来很美好的词的使用频率上振幅不同,但是波型极其相似,是同类搜索关键字。而且搜索量与天气炎热程度有密切关系。随着时间的推移,本来很美好的词的搜索量在google继续增长,其他三词则下降,似乎转向百度。我国中原地区的北方城市如太原市,呼和浩特市在此高居榜首,南方诸城均名落孙山。这似乎应了大禹治水的道理,可疏导而不可堵。

  关键字sex和make love最令人吃惊。这第二个英文词汇的搜索平台居然最多的是中文。可能但不能确定的原因:这个词在英语世界中并不常见,但被较多的中国人熟知。第一个英文词汇的分析就不用我来做了,大家可以到http://www.google.com/trends 然后输入这个词就知道了。似乎也应了大禹治水的道理,可疏导而不可堵。

  最后要说的一句是在国家的分布上我们还需要考虑Internet在各国的分布,这个数据我并没有查,所以还不能完全依赖google trends的结果来评判结果。

Advertisements
此条目发表在Uncategorized分类目录。将固定链接加入收藏夹。

2 Responses to Google Trends满足了我的好奇心

  1. Ting说道:

     沙发
    你写太多 我训练回来看

  2. Karen说道:

    我实在没有看下去的勇气了. 呵呵~ ") 

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s