Hướng dẫn cho người mới ngăn chặn việc copy nội dung trong WordPress

Hướng dẫn cho người mới ngăn chặn việc copy nội dung trong WordPress

Nếu bạn viết nội dung gốc ngày này qua ngày khác, bạn đã nhận thức được thực tế rằng các bài đăng của bạn sẽ kết thúc trên một loạt các trang web SPAM trong vài ngày đôi khi thậm chí vài phút. Một số người dùng thậm chí còn lưu ý rằng trang web có nội dung bị đánh cắp vượt xa bài đăng gốc. Thật là bực bội khi là chủ sở hữu trang web khi thấy ai đó ăn cắp nội dung của bạn mà không được phép, kiếm tiền từ nó, vượt xa bạn trong SERPs và đánh cắp khán giả của bạn. Quét nội dung là một vấn đề lớn ngày nay vì cho rằng rất dễ để ai đó đánh cắp nội dung của bạn. Trong bài viết này, chúng tôi sẽ đề cập đến nội dung blog là gì, cách bắt người dọn nội dung, cách xử lý người dọn nội dung, làm thế nào bạn có thể giảm và ngăn chặn nội dung, cách tận dụng lợi thế của nội dung , và nội dung có bao giờ tốt?

Sao chép hay ăn cắp dữ liệu là gì?

Hiện tại trên Cộng đồng WP thì các plugin nổi tiếng đang được bán gồm có Scrapes, WP Crawler, KDN. Đây là những plugin giúp một website tự tạo tin tự động, sao chép bài viết từ 1 website khác. Mức giá cho mỗi plugin này cũng khá chat, lại còn bị giới hạn theo website. Các bạn nào sử dụng sẽ phải chịu khó đầu tư. Tuy nhiên, bài viết hôm nay, mình sẽ hướng dẫn các bạn chống Scapes dữ liệu (cào dữ liệu – dịch đúng nguyên bản tiếng Anh).

Quét nội dung blog là một hành động thường được thực hiện với các tập lệnh trích xuất nội dung từ nhiều nguồn và kéo nó vào một trang web. Bây giờ thật dễ dàng để mọi người có thể cài đặt một trang web WordPress, đặt một chủ đề miễn phí hoặc thương mại và cài đặt một vài plugin sẽ đi và quét nội dung từ các blog đã chọn, để nó có thể được xuất bản trên trang web của họ.

Tại sao họ ăn cắp nội dung của tôi?

Một số người dùng của chúng tôi đã hỏi chúng tôi tại sao họ ăn cắp nội dung của tôi? Câu trả lời đơn giản là vì bạn TUYỆT VỜI. Sự thật là những người dọn dẹp nội dung có động cơ thầm kín. Dưới đây chỉ là một vài lý do tại sao một người nào đó sẽ cạo nội dung của bạn:

  • Hoa hồng liên kết – Có một số nhà tiếp thị liên kết bẩn thỉu ngoài kia chỉ muốn khai thác hệ thống để kiếm thêm vài đô la. Họ sẽ sử dụng nội dung của bạn và nội dung của người khác để đưa lưu lượng truy cập đến trang web của họ thông qua công cụ tìm kiếm. Các trang web này thường được nhắm mục tiêu đến một phân khúc cụ thể, vì vậy họ có các sản phẩm liên quan mà họ đang quảng bá.
  • Thế hệ lãnh đạo – Thường chúng ta thấy luật sư và nhân viên thực hiện việc này. Họ muốn có vẻ như các nhà lãnh đạo ngành công nghiệp trong cộng đồng nhỏ của họ. Họ không có băng thông để tạo ra nội dung chất lượng, vì vậy họ đi ra ngoài và cạo nội dung từ các nguồn khác. Đôi khi, họ thậm chí không nhận thức được điều này bởi vì họ đang trả một số tiền 30 đô la / tháng để thêm nội dung và giúp họ có được SEO tốt hơn. Chúng tôi đã gặp khá nhiều trong số này trong quá khứ.
  • Doanh thu quảng cáo – Một số người chỉ muốn tạo ra một trung tâm kiến ​​thức của người dùng. Một cửa hàng cho người dùng trong một phân khúc cụ thể. Nếu tôi có một xu cho mỗi lần ai đó thực hiện điều này với nội dung của chúng tôi, thì chúng tôi sẽ có vài trăm đồng xu. Thông thường chúng tôi nhận thấy rằng nội dung trang web của chúng tôi đang bị loại bỏ. Người cạo luôn trả lời, tôi đã làm điều này vì lợi ích của cộng đồng. Ngoại trừ trang web được dán bằng quảng cáo.

Đây chỉ là một vài lý do tại sao ai đó sẽ ăn cắp nội dung của bạn.

Làm thế nào để nắm bắt nội dung phế liệu?

Bắt người dọn dẹp nội dung là một công việc tẻ nhạt và có thể mất rất nhiều thời gian. Có một vài cách mà bạn có thể sử dụng để bắt những người dọn dẹp nội dung.

Tìm kiếm trên Google với tiêu đề bài viết của bạn

Yup mà đau như nó nghe. Phương pháp này có lẽ không đáng giá đặc biệt nếu bạn đang viết về một chủ đề rất phổ biến.

Theo dõi

Nếu bạn thêm các liên kết nội bộ trong bài đăng của mình, bạn sẽ nhận thấy một trackback nếu một trang web đánh cắp nội dung của bạn. Cách này là khá nhiều cạp nói với bạn rằng họ đang cạo nội dung của bạn. Nếu bạn đang sử dụng Akismet, thì rất nhiều trackback này sẽ hiển thị trong thư mục SPAM. Một lần nữa, điều này sẽ chỉ hoạt động nếu bạn có liên kết nội bộ trong bài viết của bạn.

Công cụ quản trị trang web

Nếu bạn sử dụng các công cụ quản trị trang web của google, thì có lẽ bạn biết về các Liên kết đến trang web của bạn. Nếu bạn xem bên dưới Traffic Traffic, bạn sẽ thấy một trang có liên kết đến trang web của bạn. Rất có thể những người dọn dẹp của bạn sẽ nằm trong số những người hàng đầu ở đó. Họ sẽ có hàng trăm nếu không phải hàng ngàn liên kết đến các trang của bạn (xem xét rằng bạn có liên kết nội bộ).

Liên kết đến trang web của bạn - Công cụ quản trị trang web của Google

FeedBurner sử dụng không phổ biến

Nếu bạn đã thiết lập Feedburner cho blog WordPress của mình , thì bạn có thể thấy một số cách sử dụng không phổ biến. Trong tab Phân tích trong Thống kê nguồn cấp dữ liệu, bạn sẽ thấy sử dụng Uncommon Uses. Ở đó bạn sẽ thấy một danh sách các trang web.

FeedBurner sử dụng không phổ biến

Làm thế nào để đối phó với Scrapers nội dung

Có một vài cách tiếp cận mà mọi người thực hiện khi giao dịch với người dọn dẹp nội dung. Phương pháp không làm gì, Giết tất cả các phương pháp tiếp cận, Tận dụng lợi thế của chúng.

Phương pháp không làm gì

Đây là cách tiếp cận dễ dàng nhất bạn có thể thực hiện. Thông thường các blogger phổ biến nhất sẽ khuyến nghị điều này bởi vì nó tốn rất nhiều thời gian để chống lại những kẻ phá hoại. Cách tiếp cận này chỉ đơn giản là khuyên bạn nên thay vì chiến đấu với họ, hãy dành thời gian của bạn để tạo ra nội dung thậm chí chất lượng hơn và có niềm vui. Bây giờ rõ ràng nếu đó là một blog nổi tiếng như Smashing Magazine, CSS-Tricks, Problogger hoặc những người khác, thì họ không phải lo lắng về điều đó. Chúng là các trang có thẩm quyền trong mắt của Google.

Tuy nhiên, trong Cập nhật Panda, chúng tôi biết một số trang web tốt đã bị gắn cờ là người dọn dẹp vì google nghĩ rằng người dọn dẹp của họ là nội dung gốc. Vì vậy, cách tiếp cận này không phải lúc nào cũng tốt nhất theo quan điểm của chúng tôi.

Giết tất cả bọn chúng Cách tiếp cận

Trái ngược hoàn toàn với cách làm của Do Do Không có gì. Trong phương pháp này, bạn chỉ cần liên hệ với người cạo và yêu cầu họ gỡ nội dung xuống. Nếu họ từ chối làm như vậy hoặc đơn giản là không trả lời các yêu cầu của bạn, thì bạn gửi DMCA (Đạo luật bản quyền kỹ thuật số thiên niên kỷ) với máy chủ của họ. Theo kinh nghiệm của chúng tôi, phần lớn các trang web cạo không có sẵn mẫu liên hệ. Nếu họ làm, sau đó sử dụng nó. Nếu họ không có biểu mẫu liên hệ, thì bạn cần thực hiện Tra cứu Whois.

Tra cứu Whois

Bạn có thể xem thông tin liên lạc trên liên hệ hành chính. Thông thường các liên hệ hành chính và kỹ thuật là như nhau. Whois cũng hiển thị các công ty đăng ký tên miền. Hầu hết các công ty lưu trữ web và công ty đăng ký tên miền nổi tiếng đều có các mẫu hoặc email DMCA. Bạn có thể thấy rằng người cụ thể này ở với Hostgator vì máy chủ tên của họ. HostGator có một hình thức khiếu nại DMCA . Nếu máy chủ tên giống như ns1.theirdomain.com, thì bạn phải đào sâu hơn bằng cách thực hiện tra cứu IP ngược và tìm kiếm IP.

Bạn cũng có thể sử dụng dịch vụ của bên thứ ba cho DMCA.com để gỡ xuống.

Jeff Starr trong bài viết của mình đề nghị bạn nên chặn IP của kẻ xấu. Truy cập nhật ký của bạn cho địa chỉ IP của họ và sau đó chặn nó bằng một cái gì đó như thế này trong tệp .htaccess gốc của bạn:

1
Deny from 123.456.789

Bạn cũng có thể chuyển hướng chúng đến một nguồn cấp dữ liệu giả bằng cách làm như thế này:

1
2
RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]

Bạn có thể thực sự sáng tạo ở đây như Jeff gợi ý. Gửi chúng đến nguồn cấp dữ liệu văn bản thực sự lớn đầy đủ với Lorem Ipsum. Bạn có thể gửi cho họ một số hình ảnh kinh tởm về những điều xấu. Bạn cũng có thể gửi chúng trở lại máy chủ của chính họ, gây ra một vòng lặp vô hạn sẽ làm sập trang web của họ.

Cách tiếp cận cuối cùng mà chúng tôi thực hiện là tận dụng lợi thế của chúng.

Làm thế nào để tận dụng lợi thế của Scrapers nội dung

Đây là cách tiếp cận của chúng tôi trong việc đối phó với những người dọn dẹp nội dung, và nó hóa ra khá tốt. Nó giúp SEO của chúng tôi cũng như giúp chúng tôi kiếm thêm tiền. Phần lớn những người dọn dẹp sử dụng RSS Feed của bạn để đánh cắp nội dung của bạn. Vì vậy, đây là một số trong những điều bạn có thể làm:

  • Liên kết nội bộ – Bạn cần liên kết CRAP ra khỏi bài viết của mình. Với tính năng liên kết nội bộ trong WordPress 3.1 , giờ đây việc này trở nên dễ dàng hơn bao giờ hết. Khi bạn có các liên kết nội bộ trong bài viết của mình, nó giúp bạn tăng số lần xem trang và giảm tỷ lệ thoát trên trang web của riêng bạn . Thứ hai, nó giúp bạn có được các liên kết ngược từ những người đang ăn cắp nội dung của bạn. Cuối cùng, nó cho phép bạn đánh cắp khán giả của họ. Nếu bạn là một blogger tài năng, thì bạn hiểu nghệ thuật liên kết nội bộ. Bạn phải đặt liên kết của bạn trên các từ khóa thú vị. Làm cho nó hấp dẫn cho người dùng nhấp vào nó. Nếu bạn làm điều đó, thì khán giả của người cạo sẽ cũng nhấp vào nó. Cứ như vậy, bạn đã đưa một khách truy cập từ trang web của họ và đưa họ trở lại nơi đáng lẽ họ phải ở ngay từ đầu.
  • Từ khóa liên kết tự động với các liên kết liên kết – Có một vài plugin như Ninja Affiliate và SEO Smart Links sẽ tự động thay thế các từ khóa được chỉ định bằng các liên kết liên kết. Ví dụ: HostGator, StudioPress , MaxCDN , Gravity Forms << Tất cả sẽ được tự động thay thế bằng các liên kết liên kết khi bài đăng này được phát hành.
  • Hãy sáng tạo với RSS Footer – Bạn có thể sử dụng RSS Footer hoặc WordPress SEO by Yoast Plugin để thêm các mục tùy chỉnh vào RSS Footer của bạn. Bạn có thể thêm bất cứ thứ gì bạn muốn ở đây. Chúng tôi biết một số người thích quảng bá sản phẩm của họ tới trình đọc RSS của họ. Vì vậy, họ sẽ thêm các biểu ngữ. Đoán xem, bây giờ những biểu ngữ đó cũng sẽ xuất hiện trên trang web của những người cạo này. Trong trường hợp của chúng tôi, chúng tôi luôn thêm một chút từ chối ở cuối bài đăng của chúng tôi trong nguồn cấp dữ liệu RSS. Nó chỉ đơn giản là đọc như Cách làm thế nào để đưa trang web WordPress của bạn vào trạng thái chỉ đọc để di chuyển và bảo trì trang web là một bài đăng từ: WPBeginnerkhông được phép sao chép trên các trang web khác. Bằng cách thực hiện điều này, chúng tôi nhận được một liên kết ngược đến bài viết gốc từ trang web của scraper cho phép google và các công cụ tìm kiếm khác biết chúng tôi có thẩm quyền. Nó cũng cho phép người dùng của họ biết rằng trang web đang đánh cắp nội dung của chúng tôi. Nếu bạn giỏi về mã số, thì bạn hoàn toàn có thể nhận được các loại hạt. Chẳng hạn như thêm các bài viết liên quan chỉ dành cho trình đọc RSS của bạn và một loạt các nội dung khác. Kiểm tra hướng dẫn của chúng tôi để thao tác hoàn toàn với nguồn cấp dữ liệu RSS WordPress của bạn .

Làm thế nào bạn có thể giảm bớt nội dung blog cào và có thể ngăn chặn nó

Xem xét nếu bạn sử dụng cách tiếp cận của chúng tôi với rất nhiều liên kết nội bộ, thêm liên kết liên kết, biểu ngữ rss và những cơ hội như vậy là bạn sẽ giảm bớt nội dung để đạt được biện pháp tốt. Nếu bạn đưa ra gợi ý của Jeff Starr về việc chuyển hướng những người dọn dẹp nội dung, thì điều đó cũng sẽ ngăn chặn những người dọn dẹp đó. Ngoài những gì chúng tôi đã chia sẻ ở trên, có một vài thủ thuật khác mà bạn có thể sử dụng.

Nguồn cấp RSS đầy đủ so với Tóm tắt

Đã có một cuộc tranh luận trong cộng đồng viết blog về việc có nguồn cấp RSS đầy đủ hay nguồn cấp RSS tóm tắt hay không. Chúng tôi sẽ không đi sâu vào chi tiết về cuộc tranh luận đó, tuy nhiên một trong những PROS của việc có một nguồn cấp RSS Chỉ là Tóm tắt là bạn ngăn chặn nội dung. Bạn có thể thay đổi cài đặt bằng cách truy cập bảng quản trị WordPress của bạn và vào phần Cài đặt »Đọc. Sau đó thay đổi cài đặt Đối với mỗi bài viết trong chương trình nguồn cấp dữ liệu: Tóm tắt.

Lưu ý: Chúng tôi có nguồn cấp dữ liệu đầy đủ vì chúng tôi quan tâm nhiều hơn đến trình đọc RSS của chúng tôi hơn là những người gửi thư rác.

SPAM theo dõi

Trackbacks và Pingbacks chắc chắn đã có những công dụng tuyệt vời, tuy nhiên, hiện tại chúng liên tục bị lạm dụng. Thông thường các chủ đề hiển thị trackback và pingback dưới hoặc trong số các bình luận. Điều này mang lại cho người gửi thư rác một động lực để cạo trang web của bạn và gửi trackback. Nếu bạn phê duyệt nhầm, thì họ sẽ nhận được một liên kết ngược và đề cập từ trang web của bạn. Đây là cách bạn có thể vô hiệu hóa Trackbacks trên tất cả các bài viết trong tương lai . Dưới đây là một bài viết sẽ chỉ cho bạn cách vô hiệu hóa trackback và ping trên các bài đăng WordPress hiện có .

Nội dung có bao giờ tốt?

Nó có thể. Nếu bạn thấy rằng bạn đang kiếm tiền từ trang web của người cạo, thì chắc chắn nó có thể. Nếu bạn thấy rất nhiều lưu lượng truy cập từ trang web của một người quét, thì nó có thể. Trong hầu hết các trường hợp, tuy nhiên, nó không phải là. Bạn nên luôn luôn cố gắng để có được nội dung của bạn được đưa ra. Nhưng bạn sẽ nhận ra khi blog của bạn trở nên lớn hơn, gần như không thể theo dõi tất cả những người dọn dẹp nội dung. Chúng tôi vẫn gửi khiếu nại DMCA, tuy nhiên chúng tôi biết rằng có rất nhiều trang web khác đang đánh cắp nội dung của chúng tôi mà chúng tôi không thể theo kịp.

Quan điểm của bạn là gì? Bạn có sử dụng bất kỳ cơ chế khác để ngăn chặn nội dung cạo? Rất muốn được nghe những suy nghĩ của bạn.

5/5 - (1 bình chọn)
[related_posts_by_tax posts_per_page="6" title="Bài liên quan" taxonomies="category,post_tag"]

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Hotline: 0974.0707.83(Zalo/Viber)