找回密碼
 立即註冊
搜索
查看: 36|回復: 0

内容抓取:对抗还是忽视

[複製鏈接]

1

主題

0

回帖

5

積分

新手上路

積分
5
元寶
0
收聽
0
聽眾
1
在線時間
0 小時
發表於 2023-11-23 12:03:40 | 顯示全部樓層 |閱讀模式
内容抓取,或者我们更愿意称之为“内容盗窃”,自互联网诞生以来一直是一个问题。对于任何经常发帖或从事搜索引擎优化 (SEO)工作的人来说,这实际上是相当令人恼火的。 你成长得越多,你就越会意识到有多少内容抓取农场。我们在 Kinsta 发布了大量内容,内容过滤是我们经常处理的问题。问题是,我应该尝试与之抗争,还是直接忽略它们并继续前进?今天我们将深入探讨两者的一些优缺点。 什么是内容抓取? 内容抓取基本上是指某人在自己的网站上使用其他人的内容(手动或通过插件或机器人自动)而不提供归属或信用。这样做通常是希望以某种方式获得流量、搜索引擎优化或新用户。这实际上违反了美国和其他国家的版权法。


Google 也不赞成这样做,并建议创建您自己的独特内容。 以下是Google 提到的几个内容抓取示例: 从其他网站复制和重新发布内容而不添加任何原始属性或值的网站 有些从其他网站复制内容,稍微修改一下(例如,替换同义词或一些自动化技术),然后重新发布 复 制其他网站内容提 手机号码列表 要而不向用户提供任何类型的独特组织或利益的网站 专门嵌入来自其他网站的视频、图像或其他媒体等内容的网站,不会给用户带来实质性的附加价值 不要将这与内容联合混淆,内容联合通常是指您重新发布自己的内容以获得更大的覆盖范围。内容分发也可以由第三方完成,但这与内容抓取之间存在微妙的界限。如果有人联合内容,则应始终使用特殊标签,例如 rel=canonical 或 noindex。



现在有许多第三方 WordPress 插件可以让您自动提取第三方 RSS 源。尽管开发人员的本意是好的,但不幸的是,他们有时会被滥用并用于内容抓取。WordPress 如此受欢迎的原因之一是它的易用性,但有时它也会适得其反。 内容抓取和内容联合之间存在微妙的界限。始终在应得的信用处给予信用。点击发推文 内容抓取农场 当同一个所有者在数十个网站上抓取内容时,我们将其称为“农场”。这些通常很容易发现,因为网站所有者通常在所有网站上使用相同的主题,甚至域名之间也略有不同。 我们在今天的帖子中使用了一个实例!?我们并不羞于指出这些类型的网站,因为它们没有提供任何价值,只会抵消内容编辑所付出的辛勤工作。这是内容抓取农场的示例。我们会存档每个链接,以防网站将来出现故障。你可以点击每一个,看到它们都使用相同的主题和相同的录制内容。通常,抓取会从许多不同的来源收集内容,我们的博客就是其中之一。 thetechworld.xyz(存档链接) mytechnewstoday.org(存档链接) mytechcrunch.com(存档链接) technewssites.xyz(存档链接) technewssites.info(存档链接) www.thetechworld.info(存档链接) www.mytechnewstoday.xyz(存档链接>) www.futuretechnologynews.info(已存档链接) futuretechnologynews.xyz(存档链接) 您可以在下面看到,他们如何简单地逐字抓取我们的博客文章,以及我们关于上述所有领域的所有文章。

回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|小黑屋|女主臺灣論壇

GMT+8, 2024-10-5 13:24 , Processed in 0.057248 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回復 返回頂部 返回列表