关于体育新闻素材的数据是怎么获取到的
本帖最后由 x_wy46 于 2014-02-21 21:30:28 编辑
个人有一个爱好就是体育,关注体育也有十多年了,从高一开始,足球篮球,国外国内,网球乒乓球
基本上是大杂烩,什么都关注一点
在读新闻的时候,发现了很多有趣的数据,下面只是从今天的新浪体育上随便复制了一点
仅仅是具体,也有自己根据以往的经历举得例子,
例子仅仅是例子,不用太认证,别立马create table,测试起来了,呵呵
也就是跟大家扯扯这些个数据是怎么来的
拜仁欧冠淘汰赛
5连胜,
追平阿贾克斯1997年创造的欧冠客场
7连胜纪录(不计上赛季决赛)。
近
18个欧冠淘汰赛主场仅负3场
拜仁近
2次欧冠做客英格兰[微博]均3比1胜出(阿森纳和曼城[微博][微博]),
最近1次欧冠没进球正是对阵阿森纳(去年3月13日主场0比2),此后在欧冠取得10连胜,
AC米兰历史上
24次主场对阵西班牙球队取得
11胜7平6负,
近
4个主场对阵西班牙球队取得1胜3平,
近4次欧冠淘汰赛对阵意大利球队均出局。
马竞期待自
1997年以来首次进入8强,
历史上8次作客对阵意大利球队取得
3胜
NBA某某球员连续N场取得**+的得分成绩,追平历史上某某球员在某某对取得该成绩,历史上之后某某几个球员在某某时候取得过这样的成绩……
某某新秀球员在连续几场得到两双,历史上怎么怎么……
某某球员在背靠背比赛中取得N连胜,且场均得分超过***分,历史上怎么怎么……
这样的新闻仅仅是举了个例子,此类统计数据数不胜数,新浪的新闻中几乎每一篇都是这样开头的
这里的数据是如何取得的?我觉得不大可能是写稿子的人一个一个从数据库查出来的
即便是一个一个查询出来的,没有一个对sql及其熟练的人,很难得出类似的数据
另外一方面,就是这些数据有很强的“自由性”,可以是任意形式的组合
什么客场,淘汰赛,小组赛,背靠背,一年级新秀,圣诞节后,新年后,得分+篮板,胜率……
很多很多的维度,感觉他的数据就是信手拈来,想怎么取怎么取
单单就一个数据来说,通过数据,写sql可能得出结果,但是他每写一遍新闻,展示了很多很多类似的统计
从上面的数据来看,有些数据的获取,并不是一件简单的事
我觉得他是利用什么专业的系统,做出各种维度复杂的统计,用的时候任意组合
就像sql查询一样强大,但是又非常简单易用的那种功能,毕竟他这个是供编辑用的
大家说说这些数据时怎么的出来的,或者是通过什么技术手段
------解决方案--------------------
嗯,还有就是专业性,就是这些小的资料,他们是耳熟能详,熟能生巧,都能倒背如流。。。
------解决方案--------------------写个爬虫全球爬
------解决方案--------------------爬虫效应,要不就是有个网络编辑部,整天在编辑稿子。每个网站都在招聘网站编辑吗,编辑下面还有小助手,这些小助手写的呗,可能是个爱好体育的人。
------解决方案--------------------
我也这样觉得~
------解决方案--------------------这是他们的吃饭本领,是专业的
业余的球迷都能掌握得七七八八
不过,后来很多媒体专栏应该都自己维护了专门的数据库了