Rất nhiều lần mình gặp câu hỏi về page size, chủ đề vẫn xoay quanh việc làm thế nào để có được page size chuẩn. Thực ra việc xác định page size chuẩn là rất mập mờ, việc xác định các thông tin này là mơ hồ. Mình chỉ xin viết bài này để có thể chia sẻ với các bạn những ý kiến của mình trong vấn đề hướng tới một page size có lợi cho việc làm SEO.
Ở bài viết này chúng ta sẻ đi vào phần tích dựa trên 2 yếu tố, một là thuật toán google và một là trên thực tế kiểm nghiệm để các bạn có thể có cái nhìn tổng quát nhất về việc này. Ngoài ra bài viết còn cung cấp những công cụ miến phí giúp bạn có thể phân tích và định lượng được page size.
Thuật toán: Hiện nay với công nghệ hiện đại đem đến một tốc độ băng thông internet cực cao, nên bạn không cần phải quan tâm đến page size.
Thực tế: Một trang quá nặng (hơn 100k, tiêu chuẩn này đựoc định lượng từ khá lâu trước đây), thì rất khó có thể được google index đầy đủ tất cả thông tin. Google bot hoạt động trên 1 quỹ tài nguyên nhất định, nếu nó phải dành nhiều thời gian để crawl hình ảnh và file pdf thì sẻ còn rất ít thời gian dành cho những phần khác.
Thuật toán: Phần nội dung không nên dài quá 1000 từ.
Thực tế: Thực ra thì không có chuẩn mực nào dành cho độ dài của phần nội dung. Bạn có thể sử dụng 2000 hay 3000 từ, mình đá từng thấy những trang web có số lượng từ còn khủng hơn con số 2000 nhưng vấn được google index đầy đủ, ko sót 1 chi tiết nào. Vấn đề bạn cần làm là đảm bảo những phần nội dung hướng tới sự thoải mái của người đọc, phần còn lại crawler sẻ đảm nhận được tất.
Thuật toán: Google không thể crawl hơn 100 links trên 1 trang.
Thực tế: Từ lâu trên blog của Mattcutts đã có bài viết về vấn đề này, cũng trong bài viết này Mr Mattcutts đã đề cập rằng google đã từ lâu nâng cao khả năng crawl của spider lên trên 100 link/1trang. Nhưng ông vẫn khuyến cáo các webmaster nên hạn chế số lượng 100 links trên 1 trang, để việc index của google được dễ dàng hơn. Vả lại việc này cũng sẻ giúp website của bạn tráng khỏi trường hợp bị liệt vào spam link, hay link farm.
Một số công cụ giúp bạn phân tích và định lượng page site:
Phần này mình muốn nhắc đến vì trên thực tế có đến 16% trên tổng lượng truy cập vào website của bạn sẻ rời website nếu họ phải chờ trên 10s, và gấp đôi số đó nếu họ phải chờ trên 15s (theo số liệu thông kê của eMarketing). Vậy hiển nhiên bạn có thể mất gần một nữa lượng truy cập và website chỉ vì việc web bạn load quá chậm. Thực tế này rất thường xảy ra với một số web hay blog sài các template null ko có bản quyền.
Giải pháp tốt nhất là cố gắng nâng cao khẳ năng hiệu dụng của server và dảm trọng lượng trang web xuống càng thấp càng tốt. Khoảng tầm 150k là vừa, nếu dưới 100k thì tốt hơn, vì với trọng lượng như thế này sẻ rất phù hợp với các trương trình cache và cả cache của google.
Web Page Speed Report giúp phân tích toàn bộ site của bạn bao gồm:
- total page size;
- total size of the images (and HTML and CSS images separately);
- JavaScript size;
- CSS size;
- Each page object size;
- And download times for a set of connection rates:
Page Size Extractor một bảng tóm tắt nhưng rất đầy đủ
- Total page size;
- Text to HTML ratio;
- Total hyperlinks number;
- Total images number;
- Total size of all images;
- Each image size;
- The full list of all links on the page.
Web Developer FireFox Extension cũng là một bảng tóm tắt nhưng khá đầy đủ về các hình ảnh lẫn nội dung coding
- Get rid of all inessential page elements;
- Clean up your CSS;
- Get rid of frames;
- Compress your images;
- Clean up your HTML, etc
Theo seovietnam.org