日期:2014-05-18  浏览次数:20501 次

发现有N多网站在偷CSDN的帖子,是怎么做到的?
大家发表下看法

------解决方案--------------------
<?xml version= '1.0 ' encoding= 'GB2312 '?>
<?xml-stylesheet type= 'text/xsl ' href= '/expert/Xsl/2.xsl '?>
<Topic>
<Issue>
<PostUserNickName> 大白菜 </PostUserNickName>
<rank> 五级(中级) </rank>
<ranknum> user5 </ranknum>
<credit> 96 </credit>
<TopicId> 5640971 </TopicId>
<TopicName> 发现有N多网站在偷CSDN的帖子,是怎么做到的? </TopicName>
<PostUserId> 1149358 </PostUserId>
<PostUserName> lubosun </PostUserName>
<RoomName> .NET技术&#32;ASP.NET </RoomName>
<ReplyNum> 0 </ReplyNum>
<PostDateTime> 2007-07-06 16:08:17 </PostDateTime>
<Point> 20 </Point>
<ReadNum> 0 </ReadNum>
<RoomId> 5202 </RoomId>
<EndState> 0 </EndState>
<Content> 大家发表下看法 </Content>
</Issue>
<Replys>
</Replys>
</Topic>
-----------------------------------------------


这个是本帖的源代码。就是一个xml解析了就可以了撒。好像csdn没有提供rss哈。

------解决方案--------------------
如果需要,手工一天可以每人复制100个以上贴子。

如果你保留csdn上10%的精选的帖子,然后主要完成自己精心设计的交互流程,就能比csdn做的出色。
------解决方案--------------------
将xml读取过来
跟据标记自己提取
------解决方案--------------------
我从03年时就开始抓CSDN的贴子了,CSDN的贴子在过去两年给我赚了几万块钱。不过因为去年我的网站被百度给封掉了,另外搞这种事真的不是很道德,所以我现在没搞了。当年大家一搜就是直接进我的,最开始在网上抓CSDN的我看到的,只有两三家。还有一家是抓我的。
------解决方案--------------------
偷的方法。

<%@ Page Language= "C# " AutoEventWireup= "true " CodeFile= "CSDNData.aspx.cs " Inherits= "CSDNData " %>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN " "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">

<html xmlns= "http://www.w3.org/1999/xhtml " >
<head runat= "server ">
<title> </title>
<style>
body{font-size:12px}
</style>
</head>
<body>
<form id= "form1 " runat= "server ">
<div>
<asp:Repeater ID= "Repeater1 " runat= "server " DataSourceID= "xmlDataSource1 ">
<ItemTemplate>
<div style= "border: 1px solid orange; padding: 5px ">
<div style= "background-color: #EFEFEF; padding: 5px ">
<asp:HyperLink runat= "server " ID= "a " NavigateUrl= ' <%#XPath( "TopicId ") %> '>
<%#XPath( "TopicName ")%> </asp:HyperLink>
<a style= "color:Red;font-weight:bold "> <%#XPath( "PostUserName ")%> </a> [ <%# XPath( "PostDateTime ")%> ]
</div>
<div style= "text-indent: 45px ">
<%#XPath( "Content ").ToString().Replace( "\n ", " <br> ").Replace( " ", "&nbsp; ") %>
</div>

<asp:Repeater ID= "Repeater2 " runat= "server " DataSourceID= "xmlDataSource2 ">