存档

‘内容聚合’ 分类的存档

机器聚合之殇

2009年7月3日

偶然之想,请不要咬文嚼字。

2007年的时候,聚合是Web2.0领域非常流行的一个词汇。如今到了2009年,聚合已经不再成为web2.0的核心,而成为了一个配料。

现在的核心是什么?显然是社交,再往里说是用户关系。Facebook用户突破2亿,基于用户关系形成的信息流获取已经完全遮盖了当年“聚合”精神。twitter的兴起,更是在信息获取和传播上将“社交”发挥到了极致。

简单回顾下,当年火极一时的聚合形态吧。Google News,当时被认为能够挑战雅虎News的东西,2008年,Google News引入了“当事人评论”功能,被认为极大提升新闻价值的,现在呢?今天,Google宣布关闭了这个功能

一个小而精彩的聚合网站:techmeme,现在techmeme正在远离科技人士关注的重心。至少我已经有半年多时间不怎么访问那个网站了,我相信国外不少知名博客也是这个状况,techmeme已经不那么吃香了。去年后半年,techmeme宣布引入了首位人工编辑,对新闻进行调整,techmeme纯聚合模式终结。

另外一个就是Digg,Digg不是纯粹的机器或者语义聚合。它引入了人的因素,由参与的人,民主的选择和推荐新闻。可惜,Digg没有在美国人民的分享精神下做大,因为人们有了更好的、更高效的分享工具:twitter和facebook。

是基于用户关系的信息流获取机制打败了Digg,在这种分享中,受益方不仅是平台,而是用户,更高效的分享和获取信息。单纯的Digg聚合被击倒了。

我们经常说社交网站,其实它们还有一个名字,社交媒体,或者是社会化媒体。的确,人们在其中的信息传播和获取活动越来越承担一个媒体角色了。

现在看来,纯粹的机器语义信息聚合就不存在,社交是未来方向。

Follow me on Twitter @caozenghuiSubscribe my reader share

Web2.0思考, 内容聚合

玩聚SR上道儿

2009年1月13日

07年郑昀做玩聚,一直没什么大的响动。直到现在的玩聚SR,算是上道了。

最近这两周,我每天不忙了,都养成登陆2-3次玩聚SR看下的习惯,经常会发现一些人分享的不错的信息,尤其时不时还会出现一些在我关注范围(阅读器、twitter为主)之外内容,这些内容很不错。从这点上看,SR从一定程度上完成了发现的目的。

发现之外,其实对于大多数人来说,SR是一个阅读工具。并不是所有的人都希望亲自从泛滥的信息海洋中去遴选过滤信息。大部分人希望有一个方便的工具去阅读,比如之前很多人干脆说希望订阅几个大牛的share,比如keso等等。

SR就是这么个工具,你完全可以通过它了解这些知名IT博客们(意见领袖)在关注什么?在讨论什么?尽而了解这个行业不断变化的热点。当然,作为一个作者,你还可以根据自己的兴趣参与到对话当中。这个时候,SR还实现了一个促进和激发热点的作用。跟techmeme相仿。

现在需要SR做的是,如何尽可能的避免产生无益的“噪音”,如何最大程度的覆盖有价值的信息源,如何去平衡不同种类share源的权重,如何做到最快速度的抓取和热点预警判断。最终呈现一个高质量的聚合内容。

它是一个热点聚合平台,基于这个平台其实可以衍生出更多的产品,包括SRBacksleaderborad等等。

最后谈点写这篇文章的感受。过去N长时间,我自己一直关注国外web2.0产品非常多,想想,如果有精力多关注些类似玩聚SR这样的国内产品,其实更有意义,毕竟国内外环境差距太大了。而且,我们太缺乏类似的产品了。

该鼓掌的时候不要吝惜巴掌,应该的。关注SR请移步这里

PS:豆瓣认领,doubanclaime2be19aaa9ab585d

Web2.0思考, 内容聚合, 社会化媒体

玩聚SR的平台效应

2008年12月30日

郑昀去年和今年中发布玩聚SD的时候,我没说什么好话(12),因为感觉不到这些产品的用户,作为一个本应该的目标用户,找不到使用它的理由,让人遗憾。郑昀在内容聚合上的执着令人钦佩。

上周推出的玩聚SR(新型的社会化推荐引擎),终于让人眼前一亮。

用郑昀的描述:玩聚SR是一种新型的社会化推荐引擎。它用于追踪IT业界人士使用的各种社会化媒体分享源,如微博客、阅读器分享、网摘收藏等,综合分享推荐的次数、推荐者权重和信息源类型等多种因素,对大家分享的链接进行实时汇总,推选出既新鲜又好看的文章。

SR的存在,实际上解决了当下blog缺乏聚合平台的一个短板。目前无论是基于wordpress等系统的独立博客,还是基于BSP的博客作者,都无法实现博客内容之间的互通。互通之外,更重要的其实是发现、推荐和共享。可以说,SR有希望解决这个问题。

在国外,实现类似作用的推荐平台则很多,比如:techmeme(通过link追踪发现tech blogger讨论热点的平台,在形成固定阅读群体后,就反向实现了制造热点的能力);Technorati(blog搜索引擎,基于权威度的排名,实际上加速了blog媒体化的前行);digg(早期的digg是一个纯正的tech(geek)文章推荐社区);类似的还有google blog search;还有类似rssmeme之类的“半成品”。

在国内,这种产品则少得可怜,只有阅读器这种热文“发育不良者”。

除了聚合平台外,SR基于社会化媒体分享源的再聚合,是一个不错的思路。我觉得,至少比单纯基于google reader share的rssmeme要更有意义吧。随着各种社交网站应用(facebook\twitter\friendfeed\reader\del.icio.us等等)的深入,信息的碎片化和个性化是必然的。如何从碎片中发现价值是web2.0探讨的永恒话题,而聚合就是找到这种价值的利器。

不少人会认为,SR毕竟是过于小众的。其实没关系,类似的聚合推荐平台必然是小众起家的,IT说小也小,说大的话也足以覆盖了一个有话语权的人群,关键看后续的成长潜力。

而成长潜力又要受制于国内社会媒体的普及度,在tech blogger们在twitter\friendfeed上玩的热火朝天的时候,99.9%的中国网民根本不知其为何物。

至于SR能不能成功?我觉得,可能有几点是比较重要的。第一个是,能否成为一个阅读工具?第二个,能否成为一个“内容推荐标竿”?第三个,能够成为一个“入口”?依次对应需要解决的是,能否解决推荐质量和覆盖度(信息源选定和算法)?如何实现标竿的建立(比如techmeme的leaderborad)?信息源的反向推荐和内容打通?

Web2.0思考, 内容聚合, 社会化媒体

机器聚合不出媒体

2008年12月5日

今天,techmeme的老大Gabe Rivera宣布了一个炸弹式消息:纯粹的机器聚合仍然存在问题,所以techmeme不能光靠机器聚合了,要引入人工的干预。并且,techmeme已经聘请了在Valleywag、wired.com工作过的McCarthy作为审核编辑。

一下子,techmeme的神话轰然倒地。

要知道,在机器聚合新闻领域,techmeme享有非常高的声望,虽然,它主要是focus在tech news领域。但其独道的link追踪效果,经常被拿来跟google这些大企业相比较。并且,在抓取速度、新闻更新以及高质量相关性上,更优于google news。其创始人Gabe也一直被认为有一套secret的聚合算法,估计这个算法堪与digg的算法媲美了。

如今,Gabe宣布机器聚合不行了,要引入人工。对机器聚合而言,不啻为一记重棒!

其实,我是觉得,Gabe此举更多的是对机器聚合新闻现状的一个“无奈之举”。直白点讲,机器能够聚合出一个优秀的“工具”,但它却不能聚合出一个优秀的“媒体”,这一点我在今年4月已经提及到。引入人工干预,至少会让techmeme更象一个有“思想”的媒体平台。我想,这就是郑昀同志提到的“画龙点睛”吧,他是一个聚合的实践者。

同为机器聚合的google news也面临这个问题,你的算法再精准,人们更多的还是把它作为一个工具,而不是在阅读。

这一点,依然可以拿几乎是同期起步的techcrunch来对比。按照Fred披露的compete的统计数据,2007年4、5月的时候,techcrunch的流量与techmeme几乎是持平的,到了2008年3月,techcrunch已经几乎是techmeme的10倍。现在呢?techcrunch的影响力和流量已经有了更大的飞跃。techmeme呢?我简单对比了下alexa,真是可怜。恐怕更失落的还有影响力吧。

更可怕的是,techmeme的工具市场也正在遭受侵袭。拿我自己的使用习惯来看,2007年和2008年上半年是我疯狂使用techmeme的一个阶段。现在一想的话,我真是已经N个月没怎么访问techmeme了。估计跟我有类似经历的tech news疯狂阅读者也不少。

why?其一,twitter等新兴工具抢占了市场,早期的twitter只是一个自言自语的地方,现在却成了一个信息获取和沟通工具,人们同时需要的工具是有限的,选择和放弃是必然的;

另外,美国blog市场的成熟,挤压了techmeme的空间,blog media品牌性加强,数量减少,人们更热衷于阅读少数的几个blogmedia获取信息。techmeme的leaderboard也被越来越少的大blog和主流媒体“全面占领”,这已经是一个techmeme被“架空”的强烈信号。如果techmeme上,天天只是出现少数几个媒体的新闻,它还有存在的必要吗?

所以Gabe希望加强techmeme“媒体平台”的属性,将其价值更大化。

问题是,媒体属性可不是这么容易做出来的,雇佣一个编辑挑选下新闻就ok了?我无意间看了下新任编辑McCarthy的想法,她说要多跟众多blog们交流,听取大家的意见,并应用到选择首页story上;大家可以随时发mail给她推荐新闻,确保新闻速度等等。

弄不好,媒体强化不成,原有的中立平台价值也丢了。

Web2.0思考, 内容聚合 ,

Google盯上blog聚合是个好事

2008年10月3日

昨天,Google推出了新版的blog search首页,最大的变化就是:按照财经、科技、政治、娱乐等主题进行了热点blog话题聚合,而不再是只提供简单的search功能。

Google官方的说法很有感染力:“Browse what the world is saying on Blog Search”。

这使得,Google blog search这个产品一下子从一个“工具”具备了向“媒体平台”跨越的可能。这也是Google此举最大的一个看点。几年前,同样思路,Google推出了News

事实上,Google不是第一家关注blog内容聚合的企业。大企业而言,雅虎在去年就推出了Yahoo Buzz,并在前不久彻底开放了内容源的提交,尽管buzz采用了Digg的投票方式,但是整合第三方内容(以blog为主)并形成平台的初衷是一致的;

小企业,则包括了在tech领域颇具影响力的techmeme,以及今年初宣布转型blog聚合平台的老牌blog搜索引擎technorati;再小的话,还包括:Six Apart’s new Blogs.com(前身是阅读器rojo.com),被纽约时报早前收购的Blogrunner等等。

于是,不少人在讨论:google的这个东西会不会是一个killer?,比如:Read/WriteWeb的 Marshall Kirkpatrick。往往一个新的东西出来,经常被定义为“XX killer”,结果没几个被kill的。Google自己的一个现成的例子就是:Google News

所以,我说,Google的这个动作,现在看,很难说:它会杀死谁!但是它确是一个很好的信号:blog内容的商业价值正在不断提升,聚合blog内容为平台正在引起更大的关注。

具体到Google上,至少它会带来大量用户关注blog内容,关注除了主流媒体以外的来自blog世界的声音,而这些用户可能之前很少关注过blog。

这才是最重要的。

Web2.0思考, blog媒体, 内容聚合 , ,

跟着郑昀说下有道热闻

2008年9月21日

本来没打算掺和,刚读了郑昀的“浅谈有道热闻的机器智能”,决定参与下。说来,真是有好长时间没讨论新闻聚合的事了,我记得上次还是在郑昀的玩聚Social Dialogue

因为之前关于新闻聚合实在是谈的太多了,所以以下全部简述。

1,郑昀说:“social参数+digg+文本相似性+反向链接计算,合起来,可能是一条路,但这条路,很麻烦,需要人,很多时间,很多人工。”

我觉得,这种想法本身就是有问题的,其实你去看,不管是Digg、techmeme,都不是因为它们抓住了所有参数,而是抓住了一个适合它们自己的算法,反复改进,就脱颖而出了。

确实,techmeme的反向link没什么高深的,Digg的算法也不高深,但它们都根据自己这套算法,根据这套算法聚合新闻的需要,进行了出神入化的挖掘改进。

2,机器的语义分析,没有止境,但要充分考虑到商业价值构建。通过花费更高的成本,更多的机器参与,理论上肯定能达到更精准的聚合结果。

但这个东西能商业化吗?所以,在前不久,微软宣布收购Powerset时,赞歌后面肯定四有隐忧的,Google之所以能成功,不是因为它的搜索算法最牛B,是因为它既照顾了用户的使用需求,同时又考虑了商业模式的嵌入,当然其中,包括成本。

3,回过头来,继续说下有道的新闻聚合。从新闻聚合的思路来看,有道热闻的尝试是值得鼓励的。我觉得,至少实践了对新闻信息分类,然后再组织的基本路子,并在后期呈现上给予了突出的体现。比如当下:最简单的无非是:新闻、博客、视频还有图片,这算是国内网民关注一个新闻的四个元素,我倒是更建议有道能聚合留言特色。

接下来,一大半的工作恐怕是提高质量。

4,在国内门户依然是网民访问新闻绝对首选的大环境下,个人认为,搜索聚合新闻的出路在于:发现和推动热点。另外,还需要有一种文化的衬托,才能有机会。在这点上,国外的例子有Digg,国内其实也有,比如百度的贴吧。

5,最后一点,搜索聚合新闻中的“博客热点聚合”太关键了。一个这方面国内还缺乏一个“入口”,没有哪一家把门槛驻高,如果对博客热点进行分类,辅以精准的质量控制,将会成为一个大的机会,一旦博客热点形成有效入口,依靠blogger自身所具有的超强传播力,足以把其推高。网易有道看到了这个机会,能做大吗?

Web2.0思考, 内容聚合 , ,

yahoo buzz依然缺乏内涵

2008年9月9日

3月份的时候,yahoo刚刚宣布推出buzz这个栏目,当时我对它的评价是“虚假繁荣”。一个基本的判断是:buzz之初的不开放性,很容易让人想到yahoo是想借机推它的publisher联盟,这个联盟是雅虎经营了很长时间,并希望对抗google的。通过buzz的吸引,让更多的第三方内容站方资源向yahoo倾斜。最大的卖点就是登上yahoo首页的机会。

前不久,yahoo把我当初批驳它的两个方面都补上了,一个是submit items彻底向公众开放,普通大众均可以注册提交内容,并在理论上获得登上yahoo首页的机会,这一点跟社交新闻网站Digg是相同的;另外一个就是,yahoo依靠它“首页推荐位”的黄金卖点吸引了大量站方资源(媒体+博客)主动增加了buzz的推荐按钮,这一点同digg早期发展是类似的。

可以说,yahoo buzz开放之后,这个游戏变得比较好玩了。

给人的感觉是:yahoo当初漫不经心的小玩意,突然间焕发出光彩来了。起码表面上看,yahoo通过buzz获得了跟媒体站方更多的合作资源和机会;通过buzz雅虎获得了更多的曝光机会,让这个老媒体巨人有了让人眼前一亮的新鲜东西;再有就是,通过buzz,雅虎整合了大量第三方内容,给了读者更多的选择,要知道,在美国这个媒体发达的市场,没有谁能穷尽一切,整合外站资源是必须,这点上从NYTimes等的思路上也能看出来。

不过事实是什么呢?buzz的最大卖点其实还是那点流量,起码现在是这个状况,大量网站希望通过buzz这个窗口获得登上yahoo首页的机会;buzz首页的流量和关注度依然低的可怜;用户的参与度依然很低,比如一些焦点文章的vote甚至不到两位数,当然,yahoo可以解释,我们评价的不仅仅是投票,还有search,还有email。

总体上将,yahoo buzz还缺乏气质,缺乏内涵,缺乏在digg上那种用户民主发动寻求新闻信息价值最大化的精神。这个可能是buzz在随后需要锻造的。

不过,值得注意的是,buzz的开放和短时间的攻城略地,倒是给我们提供了一个digg类网站能否打破魔咒走向主流的的另外一个可能的选择?毕竟yahoo有着天然的主流人群。主流人群需要这种社交新闻吗?这是我最关注buzz的一个原因。

在另一面,digg还在向主流的推进中挣扎着。

Web2.0思考, 内容聚合, 社会化媒体 , ,

郑昀的玩聚SD和社会化对话

2008年6月18日

最近郑昀的玩聚推了一个新的产品:Social Dialogue。大概的思路其实还是模仿国外techmeme的经验,通过link的方式追踪热点对话。对于郑昀同志在语义聚合方面的探索就不多夸奖了,值得鼓励,这年头在国内做内容聚合尝试不易。

下面主要多提下质疑。简单看了下,提点感想。

1,似乎这个memeTracker追踪“人与人对话”的成分过高,突出了人,反而忽略了聚合最根本的东西:内容。Techmeme的成功在于,它以人为线,提供了追踪和制造热点话题的能力。读者访问它的最大动力在于内容,人在内容后头。

2,如何发现热点,并定义热度,然后呈现出来。显然这是techmeme的核心,也是techmeme之所以是techmeme的关键。感觉SD呈现出来的还只是简单的根据blogger们更新时间的排列。如果是这样的话,阅读器其实已经帮我解决了一切,没必要再开一个页面。

3,link的缺位,国内的blogger没太多有习惯引用link的,不管是传统媒体的link,还是blog间文章的互连。国外在这方面做的很好,它们更习惯于会话和交流。

4,怎么定义价值来源。对于一个类似techmeme似的过滤器,界定来源是很重要的,少了遗漏内容,多了信息泛滥降低品质。techmeme自身掌握的非常好,就在于它既照顾了blogger,又互补式的引入了权威的媒体来源,比如NYT、CNET、WSJ。无疑,这种方式是绝对适合老美的方式,它们的媒体注意力分散。我们的呢?

5,入口问题。在这样一个注意力不断打散的时代。想让用户多一个入口太难了。大部分用户,只需要一个入口。相反,把这个功能想想集成到已经形成的入口上去,可能更现实。

6,最后落到标题的后半句上,社会化对话的形式也正在不断变化,blog本身正在由于入口效应不明显,而偏离对话的中心。Google Reader也在通过note打造对话平台等等。随之,类似friendfeed这样的聚合对话平台滋生。会话的聚合怎么走?这是个问题。

Web2.0思考, 内容聚合 ,