Những người làm việc liên quan đến thiết kế web đều biết đến khái niệm Sitemap cho Website. Nhưng đa số ( thậm chí là dân kỹ thuật ) không biết tác dụng thực sự của Sitemap trong làm Seo.
Sitemap ( bản đồ trang web hoặc sơ đồ trang web ) là một danh sách các trang của một trang web được thiết kế dành cho trình thu thập dữ liệu hoặc người sử dụng . Nó có thể là một tài liệu dưới hình thức bất kỳ được sử dụng như một công cụ lập kế hoạch thiết kế web, hoặc là một page liệt kê các trang trên một trang web, thường tổ chức theo thứ tự thời gian. Sitemap Điều này giúp du khách và công cụ tìm kiếm dễ dàng tìm thấy các trang trên trang web.“Bản đồ trang”, là thể các tổng quan về hệ thống website của bạn. Sitemap hường được lưu trữ dưới định dạng XML, hoặc HTML trên website.
Theo một định nghĩa khác từ sitemaps.org ( được Google lấy làm chuẩn ), mang tính chất kỹ thuật hơn thì:
Sitemap là cách dễ dàng khi webmaster muốn thông báo cho công cụ tìm kiếm về các trang trên trang web của họ. Hình thức đơn giản nhất của Sitemap là một tập tin XML liệt kê các URL của một trang web cùng với siêu dữ liệu bổ sung về mỗi URL (thời điểm được cập nhật lần cuối, mức độ thường xuyên thay đổi, mức độ quan trọng như thế nào, so với các URL khác trong trang web ) để các công cụ tìm kiếm có thể thu thập dữ liệu trang web một cách thông minh hơn.
Các trình thu thập Web thường khám phá các trang từ các liên kết trong trang web ( Internal link ) và từ các trang web khác ( backlink ). Sitemap bổ sung dữ liệu này để cho phép trình thu thập dữ liệu của công cụ tìm kiếm tìm hiểu kỹ hơn về những URL với các siêu dữ liệu liên quan. Sử dụng Sitemap không đảm bảo rằng các trang web được index, nhưng là cách dễ nhất cung cấp gợi ý cho trình thu thập web để công cụ tìm kiếm làm việc tốt hơn khi thu thập dữ liệu trang web của bạn.
-
HTML sitemap
- Cấu trúc: HTML sitemap liệt kê tất cả các liên kết URL trong từng phần hay từng trang khác nhau của Blog hay Website.
- Thứ tự: URL được liệt kê sắp xếp theo thứ tự thư mục và hiển thị theo tiêu đề trang.
- Đối tượng: HTML sitemap giúp người dùng di chuyển và tìm được thông tin dễ dàng.
-
XML sitemap
- Cấu trúc: XML sitemap hiển thị danh sách các URLs của blog hay Website theo chuẩn đặc biệt XML. Tham khảo ( Sitemap trên wikipedia ).
- Thứ tự: URL được liệt kê theo thứ tự ưu tiên tùy vào tiêu chí của Webmaster.
- Đối tượng: XML sitemap cho phép Webmaster thông báo tới Google về các URLs trên blog hay Website nhằm tạo thuận lợi cho quá trình index.
XML Sitemap: http://seongon.com/sitemap.xml
Sitemap hữu ích khi nào?
- Trang web của bạn có nội dung động.
- Trang web của bạn không thuận lợi cho Googlebot thu thập dữ liệu ví dụ, các trang AJAX hoặc hình ảnh phong phú.
- Trang web của bạn là mới.
- Trang web của bạn có một kho lưu trữ lớn của các trang nội dung không được liên kết với nhau.
Cách tạo sitemap
Nếu bạn dùng wordpress thì đơn giản là sử dụng Plugin Google XML Sitemaps. Nếu không, hãy theo dõi kỹ nội dung dưới đây:
Tạo sitemap bằng “tay”
Google có thể chấp nhận Sitemap trong một số định dạng, nhưng chúng tôi khuyên bạn nên tạo một Sitemap dựa trên giao thức Sitemap bởi vì cùng một định dạng có thể được hầu hết các công cụ tìm kiếm khác như Bing và Yahoo chấp nhận ( Những công cụ là thành viên của sitemaps.org).
Ví dụ về Sitemap cơ bản với một mục duy nhất cho một URL bao gồm hình ảnh và video
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1" xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1"> <url> <loc>http://www.example.com/foo.html</loc> <image:image> <image:loc>http://example.com/image.jpg</image:loc> </image:image> <video:video> <video:content_loc>http://www.example.com/video123.flv</video:content_loc> <video:player_loc allow_embed="yes" autoplay="ap=1">http://www.example.com/ videoplayer.swf?video=123</video:player_loc> <video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc> <video:title>Grilling steaks for summer</video:title> <video:description>Get perfectly done steaks every time</video:description> </video:video> </url> </urlset>
Bạn có thể tạo Sitemap của bạn bằng tay hoặc công cụ của bên thứ ba. Ngoài định dạng tiêu chuẩn nêu trên, Google cũng chấp nhận một số định dạng sau:
- RSS, mRSS và Atom 1.0 : Google chấp nhận RSS (Real Simple Syndication) 2.0 và Atom 1.0 nguồn cấp dữ liệu . Nếu bạn có một blog với một nguồn cấp dữ liệu RSS hoặc Atom, bạn gửi URL của nguồn cấp dữ liệu như một Sitemap. Hầu hết Blog đều có nguồn cấp dữ liệu. Lưu ý rằng nguồn cấp dữ liệu chỉ có thể cung cấp thông tin trên các URL gần đây. Ngoài ra, bạn có thể sử dụng một mRSS (phương tiện truyền thông RSS) Feed để cung cấp cho Google với các chi tiết về nội dung video trên trang web của bạn.
- Tập tin văn bản : Sitemap cơ bản (Sitemap bao gồm chỉ URL trang web, chứ không phải hình ảnh, video, hoặc các dữ liệu specalized khác), bạn có thể cung cấp cho Google với một tập tin văn bản đơn giản có chứa một URL trên mỗi dòng.
Ví dụ:
http://www.example.com/file1.html
http://www.example.com/file2.html
Để tạo Sitemap bằng công cụ của bên thứ 3 ( theo giới thiệu của Google ) bạn follow link sau:
http://code.google.com/p/sitemap-generators/wiki/SitemapGenerators
Công cụ miễn phí mà Seongon hay dùng là http://www.xml-sitemaps.com/
Tuy nhiên nó chỉ craw được tối đa 500 link, nếu website của bạn nhiều hơn 500link thì cần mua bộ công cụ. Nếu không muốn mua thì liên hệ seongon để được share:D
Một số chú ý khi tạo sitemap
- Một tập tin Sitemap không thể chứa hơn 50.000 URLs và không được lớn hơn 50MB khi được giải nén. Nếu Sơ đồ trang web của bạn lớn cỡ này, chia nó thành các file sitemap nhỏ hơn. Các giới hạn này đảm bảo cho máy chủ web của bạn không bị quá tải phục vụ các tập tin lớn cho Google.
- Nếu bạn có nhiều hơn một Sơ đồ trang web, bạn có thể liệt kê chúng trong một tập tin chỉ mục sitemap.
- Nếu URL mặc định của website là http://www.example.com/thì URL trong sitemap cũng phải có định dạng như vậy.
- URL trong sitemap không được chứa ID
-
Sitemap của bạn phải xác định không gian tên XML sau
: xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" .
- URL Sitemap phải được mã hóa UTF8 , và mã hóa cho dễ đọc với các máy chủ web.
- Nếu trang web của bạn có thể truy cập trên cả hai phiên bản www và không www của tên miền của bạn, bạn không cần phải gửi Sitemap riêng biệt cho mỗi phiên bản.
- Mỗi Sitepmap độc lập với mỗi ngôn ngữ của nội dung. Hãy đảm bảo rằng mỗi phiên bản ngôn ngữ có thể được thu thập dữ liệu và lập chỉ mục, sử dụng các URL duy nhất. URL này có thể được bao gồm trong các Sitemap