日期:2014-05-16  浏览次数:20417 次

关于体育新闻素材的数据是怎么获取到的
本帖最后由 x_wy46 于 2014-02-21 21:30:28 编辑
个人有一个爱好就是体育,关注体育也有十多年了,从高一开始,足球篮球,国外国内,网球乒乓球
基本上是大杂烩,什么都关注一点
在读新闻的时候,发现了很多有趣的数据,下面只是从今天的新浪体育上随便复制了一点
仅仅是具体,也有自己根据以往的经历举得例子,
例子仅仅是例子,不用太认证,别立马create table,测试起来了,呵呵
也就是跟大家扯扯这些个数据是怎么来的

拜仁欧冠淘汰赛5连胜,追平阿贾克斯1997年创造的欧冠客场7连胜纪录(不计上赛季决赛)。

18个欧冠淘汰赛主场仅负3场

拜仁近2次欧冠做客英格兰[微博]均3比1胜出(阿森纳和曼城[微博][微博]),
最近1次欧冠没进球正是对阵阿森纳(去年3月13日主场0比2),此后在欧冠取得10连胜,

AC米兰历史上24次主场对阵西班牙球队取得11胜7平6负
4个主场对阵西班牙球队取得1胜3平,
近4次欧冠淘汰赛对阵意大利球队均出局。
马竞期待自1997年以来首次进入8强,历史上8次作客对阵意大利球队取得3

NBA某某球员连续N场取得**+的得分成绩,追平历史上某某球员在某某对取得该成绩,历史上之后某某几个球员在某某时候取得过这样的成绩……
某某新秀球员在连续几场得到两双,历史上怎么怎么……
某某球员在背靠背比赛中取得N连胜,且场均得分超过***分,历史上怎么怎么……

这样的新闻仅仅是举了个例子,此类统计数据数不胜数,新浪的新闻中几乎每一篇都是这样开头的
这里的数据是如何取得的?我觉得不大可能是写稿子的人一个一个从数据库查出来的
即便是一个一个查询出来的,没有一个对sql及其熟练的人,很难得出类似的数据
另外一方面,就是这些数据有很强的“自由性”,可以是任意形式的组合
什么客场,淘汰赛,小组赛,背靠背,一年级新秀,圣诞节后,新年后,得分+篮板,胜率……
很多很多的维度,感觉他的数据就是信手拈来,想怎么取怎么取
单单就一个数据来说,通过数据,写sql可能得出结果,但是他每写一遍新闻,展示了很多很多类似的统计
从上面的数据来看,有些数据的获取,并不是一件简单的事
我觉得他是利用什么专业的系统,做出各种维度复杂的统计,用的时候任意组合
就像sql查询一样强大,但是又非常简单易用的那种功能,毕竟他这个是供编辑用的

大家说说这些数据时怎么的出来的,或者是通过什么技术手段


------解决方案--------------------
引用:
写新闻的人应该跟程序员一样积累了很多小的通用的代码片段一样,
他们积累的是小素材,具有一定的通用性,
放在合适的地方,可以直接用的那种


嗯,还有就是专业性,就是这些小的资料,他们是耳熟能详,熟能生巧,都能倒背如流。。。
------解决方案--------------------
写个爬虫全球爬
------解决方案--------------------
爬虫效应,要不就是有个网络编辑部,整天在编辑稿子。每个网站都在招聘网站编辑吗,编辑下面还有小助手,这些小助手写的呗,可能是个爱好体育的人。
------解决方案--------------------
引用:
爬虫效应,要不就是有个网络编辑部,整天在编辑稿子。每个网站都在招聘网站编辑吗,编辑下面还有小助手,这些小助手写的呗,可能是个爱好体育的人。


我也这样觉得~
------解决方案--------------------
这是他们的吃饭本领,是专业的
业余的球迷都能掌握得七七八八

不过,后来很多媒体专栏应该都自己维护了专门的数据库了