Hiện nay có rất nhiều công cụ hỗ trợ các SEOer trong việc làm SEO. Trong số đó, các công cụ seo hữu ích nhất được cung cấp bởi chính các SE. SE cung cấp tới các webmaster số lượng đa dạng công cụ, phân tích và chỉ dẫn với mong muốn họ sẽ tạo ra các trang web và nội dung có thể tiếp cận được bằng nhiều cách khác nhau. Các nguồn tài nguyên miễn phí này đem đến các điểm dữ liệu và cơ hội trao đổi thông tin với máy tìm kiếm mà chẳng nguồn nào có.
Dưới đây là các yếu tố phổ biến mà SE hỗ trợ cùng những ưu điểm của chúng:
Các chỉ lệnh SE phổ biến:
1. Sơ đồ trang web (Sitemap)
Các chỉ lệnh SE phổ biến:
1. Sơ đồ trang web (Sitemap)
Hãy tưởng tượng sitemap giống như một list các file được thiết kế dành cho trình thu thập dữ liệu trang web của các SE. Các sitemap hỗ trợ các SE tìm kiếm và phân loại nội dung trên trang web của bạn, (những nội dung mà có thể SE không tự tìm thấy). Sitemap cũng xuất hiện trong nhiều định dạng khác nhau và có thể làm nổi bật nhiều thể loại nội dung khác nhau, bao gồm video, image, thông tin, và di động.
Ban có thể đọc thêm chi tiết đầy đủ các chỉ lệnh trên Sitemaps.org. Theo đó, bạn có thể xây dựng sitemap của riêng bạn tại Sitemap Generator
Sitemap có ba loại:
XML
XML: Extensible Markup Language (Định dạng yêu cầu)
- Ưu: Đây là định dạng được chấp nhận rộng rãi cho các sitemap. Các Sitemap Generator có thể tạo ra một XML. Nhờ nó, các SE có thể dễ dàng phân tích, ngoài ra nó còn cho phép kiểm soát các thông số
- Nhược: Kích thước tập tin tương đối lớn. Kể từ khi XML yêu cầu thẻ mở và một thẻ đóng quanh mỗi yếu tố, kích thước tập tin có thể nhận được rất lớn.
RSS:
RSS : Really Simple Syndication hay Rich Site Summary
- Ưu: Dễ dàng duy trì, bảo vệ. RSS sitemap có thể được mã hóa để cập nhập tự động khi có thêm nội dung mới.
- Nhược: Khó khăn trong việc quản lý. RSS vốn là một dạng của ngôn ngữ XML, cho nên việc quản lý các thuật tính mới cập nhật trở nên khó khăn hơn nhiều.
Txt
Tập tin văn bản:
- Ưu: Cực kỳ dễ dàng. Định dạng text sitemap là một URL trên mỗi dòng, trong tổng số 50,000 dòng.
- Nhược: Không cung cấp tính năng thêm vào dữ liệu meta cho các trang.
2. Robots.txt
Tập tin robots.txt, một sản phẩm của Robots Exclusion Protocol, là một tập tin được lưu trữ trong thư mục gốc của một trang web (ví dụ www.google.com/robots.txt). Tập tin robots.txt đưa ra chỉ dẫn trình thu thập web tự động truy cập vào trang web của bạn, bao gồm cả các spider tìm kiếm.
Bằng cách sử dụng robots.txt, các webmaster có thể thông báo cho SE các khu vực giới hạn, từ chối thu thập của các Bộ tìm kiếm cũng như cho biết các vị trí của các tập tin sitemap và các thông số crawl-delay. Bạn có thể tham khảo thêm tại robots.txt.
Các lệnh sau đây có sẵn:
Disallow
Ngăn chặn các robot tuân thủ mệnh lệnh truy cập vào các thư mục hay các trang web cụ thể.
Sitemap
Cho biết vị trí của một sitemap của một trang web hay các sitemap
Crawl-delay:
Cho biết tốc độ (tính bằng mili giây) mà các robot có thể thu thập một server
Một ví dụ về robot.txt
#Robots.txt www.example.com/robots.txt
User-agent: *
Disallow:
# Don’t allow spambot to crawl any pages
# Don’t allow spambot to crawl any pages
User-agent: spambot
disallow: /
sitemap:www.example.com/sitemap.xml
Cảnh báo: Không phải tất cả các robot web đều đi theo robot.txt. Những người có ý định xấu (vd email address scraper- chương trình thu thập các địa chỉ mail) xây dựng các chương trình không làm theo phương thức này và sử dụng nó trong những trường hợp đặc biệt để xác định vị trí của thông tin cá nhân. Ví lý do này, vị trí của các bộ phận quản trị và các bộ phận riêng của các trang web truy cập công khai không được chứa trong robots.com. Thay vào đó, những trang web này có thể tận dụng các thẻ meta robots để giữ cho các công cụ tìm kiếm chính có thể lập chỉ mục nội dung có nguy cơ cao.
3. Meta robots
Thẻ meta robot tạo ra chỉ dẫn trong đến trang web cho các Robot tìm kiếm.
Thẻ meta robot phải được đặt trong thẻ “head” của tài liệu HTML.
Một ví dụ về Robot meta
Hello World
Trong ví dụ trên, “noindex, nofollow” hướng dẫn các Robot không đánh chỉ mục một trang web bất kỳ, và cũng không đi theo mất kỳ liên kết nào trên trang.
4. Rel= “Nofollow”
Nên nhớ cách các liên kết hoạt động như bỏ phiếu. Các thuộc tính rel= nofollow cho phép bạn liên kết tới một nguồn, trong khi loại bỏ vote của bạn cho mục đích tìm kiếm. Thật vậy, “nofollow” gợi ý các SE không đi theo liên kết, nhưng một vài máy tìm kiếm vẫn đi theo chúng để phát hiện ra các trang mới. Những liên kết này chắc chắn đạt được ít giá trị hơn (và không để lại hậu quả trong hầu hết các trường hợp) so với những những liên kết theo sau, nhưng có thể đem lại hiệu quả trong những trường hợp bạn chẳng may liên kết đến nguồn không tin cậy.
Một ví dụ về nofollow:
rel=”nofollow”>Example Link
Trong ví dụ trên, giá trị của liên kết sẽ không được thông qua example.com vì thuộc tính rel=nofollow đã được thêm vào.
5. Rel=”canonical”
Thông thường, hai hay nhiều bản sao của cùng một nội dung chính xác suất hiện trên trang web của bạn dưới các URL khác nhau. Ví dụ, các URL dưới đây có thể tham khảo cho một trang chủ:
_http://www.example.com/
_http://www.example.com/default.asp
_http://www.example.com
_http://example.com/default.asp
_http://Example.com/default.asp
Ví dụ về rel=”canonical” cho _http://example.com/default.asp URL
Trong ví dụ trên rel=”canonical” gợi ý cho các Robot trang này là bản sao của _http://www.example.com, và nên xem xét các URL là trùng lặp.
Đối với các SE, những URL trên xuất hiện như 5 trang riêng biệt. Bởi vì nội dung trên mỗi trang web thì đồng nhất. Điều này rất có thể là nguyên nhân tụt giảm giá trị nội dung và thứ hạng tiềm năng của trang web đó.
Thẻ canonical giải quyết vấn đề này bằng cách gợi ý cho các robot tìm kiếm trang nào là phiên bản “uy tín” nổi bật nên được tính trong kết quả tìm kiếm.
Theo Idichvuseo
DienDan.Edu.Vn Cám ơn bạn đã quan tâm và rất vui vì bài viết đã đem lại thông tin hữu ích cho bạn.DienDan.Edu.Vn! là một website với tiêu chí chia sẻ thông tin,... Bạn có thể nhận xét, bổ sung hay yêu cầu hướng dẫn liên quan đến bài viết. Vậy nên đề nghị các bạn cũng không quảng cáo trong comment này ngoại trừ trong chính phần tên của bạn.Cám ơn.