Lấy toàn bộ dữ liệu blogspot. Cách bảo vệ và ngăn chặn?

Blogspot là một dạng web 2.0 của Google được giới blogger ưa chuộng bởi nhiều tính năng cũng như sự tiện lợi dễ dùng của nó, tuy nhiên cũng vì thế mà nhiều "tệ nạn" xảy ra. Một trong số đó là nạn copy, lấy cắp full data, toàn bộ cơ sở dữ liệu của blog, những bài viết mà bạn phải đầu tư, chăm chút và dành nhiều thơi gian để đăng tải.
Blogspot bị hack, lấy toàn bộ dữ liệu
Luôn luôn phải đề phòng với những hacker thế này :(

Và tất nhiên mình cũng là một nạn nhân chỉ vừa mới hôm qua tính từ thời điểm viết bài này, Blog Cuộc sống muôn màu không những bị lấy toàn bộ data (dữ liệu), mà còn cả template, vì trước đó mình có share template này - đúng là giao trứng cho ác mà :( . Không những thế tên đánh cắp còn pm cả yahoo và nói chuyện với một thái độ rất chi là ngông: "Bạn share luôn template với data đi, khỏi mất công mình đi chôm cho đỡ mệt".

Trước tiên muốn ngăn chặn việc sao chép dữ liệu  thì cần phải hiểu cách thức lấy cắp của nó cái đã.

Cách lấy toàn bộ dữ liệu của một trang blogspot

(Bài viết này mình có tham khảo của bạn Namka, vui lòng xem trích dẫn bên dưới)
Sỡ dĩ có thể lấy cắp toàn bộ dữ liệu của blogspot chính là do 1 tính năng mà blogger cung cấp - RSS - ATOM - Nguồn cấp dữ liệu bài đăng.

Bước 1. Xác định trang blogspot mà bạn muốn lấy dữ liệu

Mình sẽ gọi blog cần lấy dữ liệu  là blog nạn nhân.
Ví dụ trang cần lấy là: http://victim.blogspot.com :D
Nguồn cấp dữ liệu bài đăng sẽ là: http://victim.blogspot.com/atom.xml.
Lưu ý: Một vài blogspot tạo Feed, Atom sử dụng công cụ của bên thứ 3, như Blog cuộc sống muôn màu sử dụng feedburner.com.

Bước 2. Xác định tổng số lượng bài viết của blog nạn nhân

Copy toàn bộ đoạn scripts dưới đây:
<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Tổng số bài viết: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="http://victim.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
<script style="text/javascript"></script>
Lưu ý: Thay địa chỉ blog của nạn nhân mà bạn muốn lấy.
Vào trang test javascripts tại đây, và dán toàn bộ đoạn scripts mà bạn đã copy ở trên, chọn "Xem trước nhanh" sẽ có được tổng số bài viết tại khung kết quả.
Ví dụ: Sau khi chạy đoạn scripts ta biết được rằng blog nạn nhân có 300 bài. Chuyển sang bước tiếp theo.

Bước 3. Tiến hành lấy toàn bộ dữ liệu về máy 

Copy đoạn bên dưới:
http://victim.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y
- Thay http://victim.blogspot.com bằng blog của nạn nhân.
- X: Bài bắt đầu lấy, tính từ bài viết mới nhất, bài mới nhất là 1, không có 0 nha.
- Y: Tổng số bài sẽ lấy tính từ X.
Ví dụ: Sau khi xác định được blog nạn nhân có tất cả 300 bài như ở trên, ta làm như sau.
Copy toàn bộ đoạn dưới đây:
http://victim.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=300
Có 2 cách thực hiện:
Cách 1: Sử dụng trình duyệt
- Dán đoạn bên trên vào thanh URL của trình duyệt.

- Click phải vào nền trang chọn "Lưu thành".
Cách lấy toàn bộ dữ liệu của một trang blogspot

Cách 2: Sử dụng trình Internet Download Manager (IDM)
- Mở trình duyệt IDM, vào Task trên thanh menu, chọn "Add new download"
Sử dụng IDM để lấy dữ liệu của blogspot

- Một hộp thoại hiện ra, Paste đoạn bên trên vào thanh Address rồi chọn download là được.
Lời khuyên: Để download nhanh chóng và thuận lợi cho việc import dữ liệu, ta nên chia nhỏ như sau:
- Lấy từ bài 1 đến bài 100:
http://victim.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100
- Lấy từ bài 101 đến bài 200:
http://victim.blogspot.com/atom.xml?redirect=false&start-index=101&max-results=200
- Lấy từ bài 201 đến bài 300:
http://victim.blogspot.com/atom.xml?redirect=false&start-index=201&max-results=300
Lưu ý: Nếu sử dụng blog có template khác với template của nạn nhân để import toàn bộ dữ liệu, thì bài viết có thể trông sẽ không được đẹp và còn nhảy lung tung :D
Đây chính là file chứa toàn bộ database của blog nạn nhân mà ta đã tải về, công việc tiếp theo là Import vào một blog bất kì của bạn.
File chứa dữ liệu của blogspot

Bước 4. Nhập, import dữ liệu vào blogspot

Truy cập vào trang quản trị blog của bạn, vào Cài đặt/ Khác, chọn "Nhập blog"
Cách import dữ liệu vào blogspot

Lần lượt chọn các tập tin atom mà bạn đã tải về, nhớ nhập mã Capcha nha.
Cách nhập dữ liệu vào blogspot

Tới đây thì chắc các bạn cũng biết cả rồi nên mình không dài dòng nữa.
Chú ý: Khi import xong nên đăng lấy lệ một vài bài để xóa bỏ Mã Capcha, tránh việc import quá nhiều bài cùng một lúc sẽ bị google cho là spam.

Cách cài đặt để ngăn chặn vào bảo vệ dữ liệu của blogspot

Ăn cắp dữ liệu thì khá chi tiết và dài dòng, nhưng để ngăn chặn thì lại khá đơn giản,  tuy nhiên, đây chỉ là cách tương đối thôi, gặp phải cao thủ hoặc "chuyên gia ăn cắp bằng tay" thì cũng chịu các bạn ạ :(
Hầu như nhiều blogger ít để ý đến tính năng sẵn có này của Google, đó là cài đặt nguồn cấp dữ liệu cho blog của bạn. Chính vì điều này nên đã tạo điều kiện thuận lợi cho những kẻ ăn cắp vặt lộng hành.

Đầu tiên, các bạn cũng vào Cài đặt/ Khác, phía dưới công cụ Nhập - Xuất - Xóa Blog là công cụ tùy chỉnh nguồn cấp dữ liệu. Thiết lập như sau:
Cài đặt ngăn chặn và bảo vệ dữ liệu blogspot

Tại sao lại thiết lập như vậy?
Đầu tiên các bạn vào nguồn cấp dữ liệu của Blog cuộc sống muôn màu để tham khảo.
http://feeds.feedburner.com/Cuocsongmuonmau-smile
Cài đặt và bảo vệ blogspot

- Cho phép nguồn cấp dữ liệu: Đến dấu ngắt
Thiết lập này khiến cho kẻ cắp chỉ lấy được một phần của bài viết, từ đầu bài cho đến dấu ngắt dòng.
Lưu ý: Mỗi khi viết bài, bạn phải chèn dấu ngắt dòng cho bài viết, vừa có thể sử dụng được tính năng này, vừa giảm nhẹ thời gian tải trang (loading) của blog.
Cách đặt dấu ngắt dòng như sau:
- Đặt con trỏ chuột vào vị trí cần ngắt, tốt nhất là ở sau bức hình đầu tiên của blog.
Cách thêm dấu ngắt dòng cho blogspot
- Chân trang nguồn cấp dữ liệu bài đăng:
Chèn một nội dung nào đó giúp thông báo với mọi người rằng bạn là chủ sở hữu của bài viết đó, bạn có thể chèn bằng mã HTML và gắn link vào, thế là mỗi khi có kẻ ăn cắp bài viết thì ta sẽ có 1 backlink miễn phí (Thật ra, nếu kẻ ăn cắp để ý thì vẫn hoàn toàn có thể xóa được, tuy nhiên việc ăn cắp dữ liệu với số lượng lớn thì việc vào từng bài và xóa là cả một vấn đề)

Share on Google Plus

Tác giả: Đặng Việt Hoàng

This is a short description in the author block about the author. You edit it by entering text in the "Biographical Info" field in the user admin panel.
    Blogger Comment
    Facebook Comment

37 nhận xét :

  1. cái blog của anh khá dễ thương (k)

    ReplyDelete
  2. Cảm ơn bác. Em mới phát hiện có thằng chôm sạch tài liệu của em.may nhờ có bác

    ReplyDelete
  3. Blog của mình đăng video youtube nên nó lấy cũng chả sao. Đằng này còn bị lấy cái description với cả tag nữa nhìn mà ức chế. Cậu có cách nào chặn được không?
    homhinhvl

    ReplyDelete
    Replies
    1. Ak mà sao cậu trên chèn link được mà mình không chèn được nhỉ?

      Delete
  4. làm sao để có cái link feed vậy bạn?
    site mình: http://taigamehay07.blogspot.com/ nhờ bro chỉ giáo

    ReplyDelete
    Replies
    1. Bạn làm như hướng dẫn là được: http://taigamehay07.blogspot.com/atom.xml

      Delete
  5. cái này tks bạn mình dễ làm blog vệ tinh

    ReplyDelete
  6. CHƯƠNG TRÌNH LÌ XÌ ĐẦU NĂM CHO KHÁCH THAM QUAN TẠI ĐỒNG HỒ QUEEN WATCH
    Siêu khuyến mãi đồng hồ hiệu chính hãng giá sĩ tại tphcm. Chương trình giảm giá đặc biệt cho khách hàng có nhu cầu mua đồng hồ đeo tay, đồng hồ treo tường, đồng hồ thời trang nam nữ, đồng hồ tượng chính hãng thương hiệu Thụy Sĩ, Anh, Pháp, Ý, Nhật, …..
    Ngoài ra khách hàng còn dược nhận nhiều phần quà giá trị hấp dẫn khi mua đồng hồ
    Hệ thống cửa hàng đồng hồ Queen Watch với hệ thống phân phối rộng khắp tại Tp.HCM
    Queen Plaza Quận 1 : 242 Trần Hưng Đạo, Quận 1, Tphcm
    Queen Watch Quận 3: 640 Cách Mạng Tháng 8, Quận 3, Tphcm
    Queen Watch Quận 4 : 234A Khánh Hội, Quận 4, Tphcm
    Queen Watch Quận 9 : 43 Lê Văn Việt, Quận 9, Tphcm .
    Queen Watch Quận 11 : 989 Ba Tháng Hai, Quận 11, Tphcm
    Queen Watch Gò Vấp: 35 Quang Trung, Quận Gò Vấp, Tphcm.
    Queen Watch Phú Nhuận : 337 Phan Đình Phùng, Quận Phú Nhuận, Tphcm.
    Queen Watch Âu Cơ : 674 Âu Cơ, Quận Tân Bình, Tphcm .
    Queen Watch Trường Chinh : 282 Trường Chinh, Phường 13, Quận Tân Bình, Tphcm .
    Queen Watch Phú Lâm : 487 Nguyễn Văn Luông – Phường 12 – Q.6 – Tp.HCM
    Queen Watch Long Xuyên : 59 Trần Hưng Đạo, Tp. Long Xuyên, Tình An Giang .
    Trung tâm sửa chữa bảo hành Queen Watch
    Địa Chỉ : 242 Trần Hưng Đạo, Quận 1, Tphcm – Tel : (08) 38368133
    Liên hệ tư vấn bán hàng tại Queen Watch
    Hotline : 0903 342 251 (Mr. Hùng) - 0912 355 503 (Ms.Mai)
    Head Office : (08) 3775 0679 – (08) 3775 0680
    Mua ngay: hái lộc đầu xuân cùng queen watch hoặc hai loc dau xuan cung queen watch

    ReplyDelete
  7. Sàn Giao Dịch BĐS Đất Vàng chuyên phân phối căn hộ Hoàng Anh Thanh Bình
    Các loại căn hộ 2 pn, 3pn, căn shop thương mại - dịch vụ, căn penhouse, căn hộ sân vườn.
    Giá cả hợp lý chủ đầu tư:
    Diện tích: Diện tích: 73m2 - 81m2 - 92m2 - 113m2 - 149m2 …
    Phương án thanh toán linh hoạt, giao nhà hoàn thiện, có nội thất.
    Liên hệ nhận thông tin bảng giá và đi xem căn hộ:
    Nguyễn Văn Toán

    Sàn giao dịch bất động sản Đất Vàng cung cấp cho bạn các thông tin cần thiết để bạn có cái nhìn tổng thể về thị trường BĐS năm 2015.
    Web: Căn hộ Hoàng Anh Thanh Bình
    Click vào Keywords: Căn hộ Hoàng Anh Thanh Bình quận 7, TPHCM
    Click vào Keywords: Can ho Vinhomes Central Park Tan Cang

    ReplyDelete
  8. Mai Phương Huy cung cấp dịch vụ ban may photocopy - cho thue may photocopy giá tốt nhất chính hãng . Xin liên hệ công ty Mai Phương Huy để có giá cả hợp lý nhất.
    Mai Phương Huy Chân thành cám ơn người dùng!

    ReplyDelete
  9. Dịch vụ ban may photocopy - cho thue may photocopy Mai Phương Huy luôn đặt hài lòng của khách hàng là mục tiêu.Xin liên hệ chúng tôi để có giá cả hợp lý nhất.
    Mai Phương Huy chân thành cám ơn quý khách hàng.

    ReplyDelete
  10. Cám ơn chi sẻ của bạn nhé!
    Mình bán bột trà xanh nguyên chất: Không chất bảo quản, không hương liệu, chất tạo màu.
    Xem thêm tại đây nhé:http://www.traxanhbaoloc.com.vn/2015/03/bot-tra-xanh.html

    ReplyDelete
  11. Cái này được à nhe.
    Hehe để em kiếm cái blog thực hành cái coi
    www.dangquangad.com

    ReplyDelete
  12. mình có cách nào hack được quyền quản trị blogspot kg bạn ơi

    ReplyDelete
  13. mình muốn tìm 1 hacker có thể hack dc quyền quản trị blog. giá cả kg phải suy nghĩ. vui lòng liên hệ 0965402650

    ReplyDelete
  14. in tem bảo hành
    sâm cau
    ông tác nhiệm kỳ của Quốc hội kiến nghị khóa XIV và các khóa tiếp theo tiếp tục tăng cường đại biểu Quốc hội chuyên trách lên khoảng 40%
    củ ba kích ột chút bởi chúng tôi đã mất 2 trung vệ và sau đó chúng tôi mất nốt Ramsey vì chấn thương. Mertersacker bị một vết rách ở gần mắt. Trong khi đó, Ramsey gặp vấn đề ở đùi còn Gabriel đối mặt v

    ReplyDelete
  15. Dự án Eco Green CT2 Nguyễn Xiển
    Chung cư Five Star Kim Giang Thanh Xuân Hà Nội
    Căn hộ Rivera Park Vũ Trọng Phụng mở bán
    Dự án Riverside Garden Vũ Tông Phan
    Dự án cao cấp chủ đầu tư HDI chung cư The Golden Palm Lê Văn Lương
    Paragon Tower Duy Tân Cầu Giấy
    Chung cư quận Thanh Xuân 82 Nguyễn Tuân

    ReplyDelete
  16. Tks bạn nhé
    Đọc báo thấy nhiều ng cũng làm cách này và thành công

    ReplyDelete
  17. Tks bạn đã chia sẻ nhé, thông tin rất hữu ích
    kênh tin nóng

    ReplyDelete
  18. Chuyên bán dự án Kenton Node Hotel Complex:
    Website : căn hộ Kenton Node Quận 7
    Website : Dự án Kenton Node Quận 7
    Website : Kenton Node

    ReplyDelete