Có thể bạn biết rằng: Nếu không được Google Index thì với Website bạn sẽ không xuất hiện cho bất cứ truy vấn nào. Và các bạn sẽ không nhận được bất kỳ lưu lượng để truy cập tự nhiên nào cả.

Đó cũng là lý do bạn đang ở đây, đúng không? Vậy thì chúng ta hãy cùng bắt tay vào việc ngay thôi! Trong viết này, 123job sẽ hướng dẫn bạn cách khắc phục bất kỳ sự cố nào của Google Index là gì và cách vào Index Google nhanh nhất mà bạn nên biết!

I. Google Index là gì?

Google Index chính là quá trình Google thu thập và phân tích dữ liệu của một số trang web, sau đó cùng cho hiển thị chúng ở trên trang kết quả tìm kiếm. Google không Index một trang nào đó, thì cũng đồng nghĩa trang đó sẽ không xuất hiện trên trang Google. Nếu như bạn đang thầm nghĩ “nói cái gì vậy trời?”. Thì hãy cùng xem qua ví dụ dễ hiểu hơn nhé:

Khái niệm Google Index là gì?

Khái niệm Google Index là gì?

Ví dụ, khi các bạn viết một cuốn sách, tuy nhiên chẳng may khi không có thư viện, nhà sách (hoặc thậm chí là những trang bán sách trực tuyến) nào trưng bày cuốn sách của bạn, thì sẽ không một ai có thể tìm thấy cuốn sách đó. Họ có thể còn chẳng biết tới sự tồn tại của cuốn sách mà bạn viết. Google Index cũng hoạt động theo đúng cơ chế tương tự vậy.

II. Cách kiểm tra xem bạn có được Google Index hay không?

Đầu tiên, bạn hãy truy cập Google, sau đó tìm kiếm một trang Web của bạn bằng “site:” + “website bạn muốn tìm kiếm”.

Ví dụ như là website tôi là 123job.com. Nếu các bạn muốn xem trạng thái chỉ mục của một URL cụ thể cũng cần chỉ cần áp dụng cách tương tự.

Chỉ cần truy cập vào: Google Search Console > Index > Coverage

Nếu như hai con số này có tổng số khác 0, thì Google Index ít nhất một số Site trên trang Web của bạn. Nếu không, thì các bạn có một vấn đề khá nghiêm trọng vì không có trang nào của bạn vào được index cả nhé! Bạn cũng có thể sử dụng Search Console để có thể xem một trang cụ thể để có được Google Index hay không. Để làm điều đó, hãy cùng dán URL vào công cụ Kiểm tra URL.

III. 10 cách Index Google nhanh nhất

1. Xóa mã Crawl Block trong tệp robots.txt

Google index không index toàn bộ trong trang Web của bạn? Đó có thể là do trong tệp robots.txt của các bạn có chứa đoạn mã đã chặn Google gây nên.

Để kiểm tra, các bạn hãy áp dụng cách Google Index nhanh nhất này: Truy cập yourdomain.com/robots.txt sau đó tìm một trong hai đoạn mã sau:

1. User-agent: Googlebot2. Disallow: /
2. User-agent: *2. Disallow: /

Cả hai đoạn mã này cũng đều báo Googlebot biết rằng chúng không cho phép thu thập dữ liệu bất cứ trang nào trên Web của bạn. Thế nên để có thể khắc phục sự cố, các bạn chỉ cần xóa chúng đi là xong.

Hơn thế nữa, Crawl Block ở trong robots.txt cũng có thể chính là thủ phạm khiến cho Google không index những trang lẻ trên Web. Để kiểm tra thì bạn dán URL vào các Công cụ URL Inspection Tool trong Google Search Console. Nhấp vào Coverage Block để có thể hiển thị thêm chi tiết, sau đó tìm kiếm “Crawl Allowed? No: Blocked by robots.txt”.

Nếu có thì chắc rằng trong trang bị chặn trong robots.txt. Trong trường hợp đó, hãy cùng kiểm lại tệp robots.txt để xem có lệnh “Disallow” nào có liên quan đến trang hay tiểu mục liên quan không nhé!

2. Xóa thẻ Noindex giả

Google sẽ không index trang nếu như bạn đã yêu cầu Noindex. Cái này cũng chỉ có ích khi bạn muốn giữ một vài trang Web ở chế độ riêng tư. Có hai cách để thực hiện tìm xóa thẻ trong Noindex như sau.

Phương pháp 1: Thẻ Meta

của chúng sẽ không vào được Google index:

  • Những trang có một trong những thẻ Meta này trong phần
  • Những trang có thẻ Meta này thì cũng sẽ không được index. 

Để tìm tất cả trang có thẻ Meta có thể ngăn index trên trang. Bạn có thể sử dụng Ahrefs’ Site Audit để thu thông tin sau đó đến Indexability, tìm “Noindex page”.

Phương pháp 2: X ‑ Robots-Tag
Công cụ để kiểm tra URL trong Search Console sẽ cho chúng ta biết liệu Google Index có bị chặn thu thập các thông tin trang do Header này hay không. Bạn chỉ cần nhập URL, sau đó hãy tìm kiếm “Indexing allowed? No: ‘noindex’ detected in ‘X‑Robots-Tag’ http header”

Bạn cũng có thể rà soát những vấn đề này thông qua Ahrefs. Cụ thể, hãy cào thông tin trong công cụ Ahrefs’ Site Audit. Sau đó dùng  bộ lọc “Robots Information in HTTP header” trong Page Explorer. Sau đó yêu cầu về Team Developer loại trừ trang các bạn muốn index bằng cách trả lại Header này.

3. Đưa trang vào Sitemap

Sitemap có công dụng gì?
Sitemap (hay sơ đồ trang Web) cho Google biết trang nào ở trên Website bạn là quan trọng và trang nào thì không. Nó cũng có thể cung cấp một vài hướng dẫn về tần suất bao lâu thì bạn nên cào thông tin 1 lần.

Google có thể tìm thấy những Page Website bạn bất kể chúng có trong Sitemap hay không, tuy nhiên bạn vẫn nên đưa chúng vào nhé!

Để xem một Page bất kỳ có trong Sitemap hay chưa thì chúng ta hãy sử dụng công cụ kiểm tra URL trong Search Console. Nếu các bạn thấy lỗi “URL không có trên Google” và “Sitemap: N/A”, thì chắc hẳn là không có trong Sitemap hay đã được index Google.

Còn trong trường hợp bạn không sử dụng Search Console thì hãy áp dụng cú pháp: yourdomain/sitemap.xml— và tìm kiếm ở trên Google.

Nếu có kết quả tương ứng để trả về thì trang này đã được Google Index, và ngược lại. Hay nếu như bạn muốn tìm tất cả trang đã cào và index mà không có ở trong Sitemap. Thì lại sử dụng Ahrefs’ Site Audit, tới Page Explorer và áp dụng những bộ lọc sau:

Sẽ lọc được nhiều trang nên Index Google tuy nhiên chưa được thêm vào Sitemap, vì vậy hãy thêm chúng vào Sitemap nhé! Sau khi hoàn thành thì cho Google biết rằng bạn đã cập nhật Sitemap của mình qua cách Ping URL này: http://www.google.com/ping?sitemap=http://yourwebsite.com/sitemap_url.xml. Thay thế vào phần cuối cùng đó qua URL Sitemap của bạn.

4. Xóa các Canonical Tag giả mạo

Cách index Google nhanh nhất chính là xóa các Canonical Tag giả mạo. Canonical cho Google biết đâu là phiên bản tối ưu hóa hơn của trang, trông giống như sau:

Hầu hết trang hay không có Canonical Tag hoặc sẽ có cái được gọi là Canonical Tag tự tham chiếu – Cho Google biết rằng chính trang này cũng là phiên bản duy nhất được ưa thích. 

Nói cách khác thì đây là trang bạn mong muốn được index Google.Tuy nhiên nếu trang của bạn đang có Canonical Tag giả mạo. Thì Google sẽ không biết về phiên bản để có thể ưu tiên ấy và chắc chắn, trang của bạn sẽ không được Google index. Để Check Canonical, hãy sử dụng công cụ để kiểm tra URL của Google. Bạn sẽ thấy cảnh báo “Trang thay thế có Canonical Tag” nếu như Canonical trỏ đến một trang khác. Để làm nhanh hơn trên Ahrefs, các bạn có thể vào Ahrefs’ Site Audit để cào thông tin sau đó đến Page Explorer, áp dụng những cài đặt sau:

Thao tác này giúp cho việc tìm kiếm các Page trong sitemap có những Canonical Tag không tự tham chiếu ( hay Non-self-referencing canonical tags). Những kết quả trả về là trang có thẻ Canonical không hợp lệ. Hay không nên có trong Sitemap của các bạn ngay từ đầu.

5. Đảm bảo các trang không “mồ côi”

Các trang mồ côi là trang không có Internal Link trỏ tới chúng. Vì Google phát hiện ra nội dung mới thông qua cách thu giữ thông tin trên Web vậy nên họ không thể khám phá trang mồ côi ở trong quá trình đó. 

Khách truy cập trang Web cũng sẽ không thể tìm thấy chúng nếu như bạn không dẫn dắt họ. Để kiểm tra trang mồ côi, tiếp tục thu thập các dữ liệu Web bằng  Ahrefs’ Site Audit. Tiếp theo, nhấp để xem báo cáo Links để tìm lỗi “Orphan Page ( hay has no incoming internal links)”:

Cách này hiển thị tất cả các trang có thể Google Index và hiển thị trong Sitemap tuy nhiên không có Internal Link nào trỏ đến chúng cả.

Xem thêm: Google Webmaster Tools là gì? Hướng dẫn cài đặt và sử dụng Google Search Console

6. Sửa các Internal Link Nofollow

Link Nofollow là các Link có thẻ rel = “nofollow”, có thể ngăn chặn việc chuyển PageRank đến URL đích. Google cũng không thể thu thập thông tin những Link  Nofollow.

Google đã nói rằng: Về cơ bản, việc sử dụng Nofollow khiến cho bọn họ loại bỏ các liên kết mục tiêu khỏi các biểu đồ tổng thể của Web. Tuy nhiên, các trang mục tiêu vẫn có thể xuất hiện trong chỉ mục của họ nếu như các trang Web khác liên kết đến chúng mà không sử dụng Nofollow hay nếu URL được gửi đến Google trong Sitemap.

Tóm lại, để dễ hiểu hơn thì bạn cần đảm bảo rằng tất cả những Internal Link đến những trang có thể Index Google theo dõi. Để có thể thực hiện việc này, hãy sử dụng công cụ Ahrefs’ Site Audit và thu thập dữ liệu trang Web rồi đi tới báo cáo Link để biết những trang có thể index có lỗi “Page has nofollow incoming internal links only” 

7. Thêm Internal Link “mạnh”

Như tôi đã nói ở phía trên: Google phát hiện ra nội dung mới qua cách thu thập dữ liệu Website. Nên nếu như bạn sơ ý không Internal Link đến trang được đề cập thì bọn họ có thể không tìm thấy trang được. Và ác giải pháp dễ nhất là thêm một vài Internal Link vào trang các bạn muốn Google Index.

Tuy nhiên, nếu như bạn muốn Google index trang nhanh nhất có thể, bạn nên đi link từ nhiều trang “mạnh”, trang quan trọng trên Web. Tại sao? Bởi vì khả năng cao là Google thu giữ các thông tin trang này nhanh hơn so với trang ít quan trọng hơn.

Dựa vào Ahrefs Site Explorer. Bạn chỉ cần nhập tên ở miền sau đó truy cập báo cáo Best by links. Tất cả trang trên Web sẽ được hiển thị và được sắp xếp theo Xếp hạng URL (UR). Nói cách khác thì nó hiển thị các trang có thẩm quyền nhất từ trên xuống dưới. Đọc lướt danh sách này có thể tìm trang liên quan để thêm Internal Link vào trang được đề cập là được.

8. Đảm bảo trang có giá trị và Unique (duy nhất)

Google sẽ “chần chừ” không Google Index các trang chất lượng thấp vì vậy chúng không có giá trị gì đối với người sử dụng, theo như những gì John Mueller của Google nói về index vào năm 2018:

Kết quả sẽ trả về nhiều trang Thin Content có thể index và hiện không nhận được Organic Traffic nào (đồng nghĩa cùng với việc không được Google index)..

Xuất báo cáo, sau đó hãy dán tất cả những URL vào URL Profiler và chạy kiểm tra Google Indexation. Sau khi Check trang chưa được Google index vì vậy chất lượng Content thì lên kế hoạch để cải thiện Content nhé! Rồi yêu cầu index lại ở trong Google Search Console.

Bạn cũng nên cố gắng để khắc phục sự cố cùng với Duplicate Content. Google không có khả năng Google Index trang trùng lặp hay gần trùng lặp nội dung. Để Check cái này thì các bạn chỉ cần sử dụng báo cáo Duplicate Content trong Ahrefs Site Audit

9. Xóa bớt những trang chất lượng thấp

Có thể bạn chưa biết: Có quá nhiều trang chất lượng thấp ở trên trang Web sẽ làm lãng phí ngân sách để làm giảm tốc độ khi thu thập thông tin.

Google nói rằng: Việc lãng phí tài nguyên máy chủ trên [trang có giá trị gia tăng thấp] sẽ thực hiện tiêu hao hoạt động để thu giữ thông tin từ trang thực sự có giá trị, điều này có thể gây ra về sự chậm trễ đáng kể trong việc khám phá những nội dung tuyệt vời ở trên trang Web.

Ví dụ như giáo viên trên lớp để chấm bài bạn, thì tất nhiên chấm điểm 10 bài cũng sẽ nhanh hơn là chấm điểm cả trăm bài, đúng chứ? Google tuyên bố rằng “phần lớn những trang Web có ít hơn vài nghìn URL sẽ được thu thập các thông tin một cách hiệu quả hơn.”

Tuy nhiên, xóa trang về chất lượng thấp khỏi trang Web không phải hành động thừa mà còn có thể có những tác động tích cực đến hiệu quả thu thông tin.

10. Xây dựng các Backlink chất lượng cao

Trong cách Google Index nhanh nhất cần biết đó là Backlink. Những Backlink cho Google biết rằng một trang Web của bạn có quan trọng hay không, có thẩm quyền hay không. Cơ bản, nếu như ai đó đang liên kết với Web, thì Web này cần phải có một số giá trị. Và đấy chính xác là loại trang mà Google muốn index.

Để hoàn toàn sự minh bạch, Google không chỉ index những trang Web có Backlink. Có rất nhiều (hàng tỷ) trang được index mà không có Backlink

Tuy nhiên, vì vậy Google coi trang có liên kết có chất lượng cao quan trọng hơn, nên chúng có khả năng để thu thập thông tin — Và thu thập lại thông tin .Những trang như vậy sẽ nhanh hơn những trang không có. Tức là nếu được thì Google Index nhanh hơn.

IV. Lưu ý sau khi google index là gì?

Những lưu ý sau khi sử dụng Google Index
Những lưu ý sau khi sử dụng Google Index 

1. Thường xuyên kiểm tra index 

Định kỳ từ 2-4 tuần các bạn cần kiểm tra những chỉ số index để thay đổi và tối ưu phù hợp. Các chỉ số này sẽ bao gồm

- Vị trí của bài viết và website trên Google 

- Số lần hiển thị URL bài viết 

- Số lần để nhấp chuột dẫn đến website 

- Tỷ lệ nhấp chuột đó là: CTR = số lần nhấp chuột/ số lần hiển thị 

2. Chia link index theo nhóm ở từ khóa theo chủ đề

Chia link index theo nhóm chủ đề có nghĩa là bạn gom những link bài viết cùng một chủ đề vào cùng với 1 URL khác nhau. Ví dụ những bài viết cùng về chủ đề công nghệ gom vào mục “Tin công nghệ” với chủ đề khuyến mãi gom vào “Tin khuyến mãi”. 

Việc này không chỉ giúp các bạn quản lý nội dung dễ dàng hơn mà Google cũng “đọc” nhanh hơn và index dễ dàng hơn. 

3. Thay đổi link index nếu như link không có giá trị cho người sử dụng.

Bài viết không được index có nghĩa là thông qua quá trình thu thập thì đánh giá dữ liệu Google nhận thấy các bạn không thể cung cấp thông tin hữu ích nào cho người sử dụng. Chỉ khi link index mang ý nghĩa cho cộng đồng để tra cứu trên google thì bài viết và website của bạn mới được để đánh giá cao và đứng top. Chính vì thế, mặc dù làm tất cả những cách mà Google vẫn không index bạn hãy thay đổi và tạo ra một đường link giá trị hơn.

V. Điểm khác biệt trong việc Index của Google 

Google index chính là quá trình index dữ liệu những website của công cụ tìm kiếm Google. Về bản chất, Google index là sự biểu thị nhiều số liệu hay dữ liệu của website mà Google đã được lưu lại vào trong cơ sở dữ liệu. Để thực hiện công đoạn index này thì Google sử dụng một công cụ năng động với chức năng lan tỏa khắp những trang web có liên quan đến một trang ban đầu mà nó đang tiến hành crawl dữ liệu. Công cụ này còn được gọi là Googlebot hoặc Google Spider (hay Search Indexer).

Như vậy, về cơ bản, với việc index của Google cũng tương đối giống những công cụ tìm kiếm khác nhau. Tất cả dữ liệu của website sẽ bao gồm các bài viết, đường link và tất cả các dữ liệu khác trên trang sẽ được Google ghi lại và sau đó lập chỉ mục chúng và lưu vào ngân hàng dữ liệu. Những chỉ mục này tương tự như một danh sách thống kê các cuốn sách ở trong một thư viện, trong đó hãy liệt kê các thông tin về tất cả các cuốn sách thư viện có sẵn. Và Google sẽ liệt kê tất cả các trang web mà nó biết tới giống như là việc lập danh sách tất cả các cuốn sách trong thư viện.

Tuy nhiên, có một sự khác biệt cơ bản ở trong việc Google Index đó là ngoài việc thu thập và index những dữ liệu liên quan đến website, Google còn lưu các trang và nội dung có liên quan tới trang đó và đánh giá chất lượng của các thông tin đó. Vì vậy, khi người sử dụng tìm kiếm một thông tin nào đó, Google Search không chỉ trả về kết quả tốt nhất với thông tin đó, mà còn cả các thông tin có liên quan theo xu hướng người sử dụng hiện nay.

Xem thêm: Meta Description là gì? Mách bạn cách viết Meta Description chuẩn SEO

VI. Kết luận 

Ở bài viết trên, 123job đã chỉ ra toàn bộ các thông tin về Google index bao gồm: Khái niệm Google index là gì? Hướng dẫn kiểm tra Google index và cách để có google index nhanh nhất. Với những webmaster và Seoer đây là nội dung vô cùng hữu ích và cần phải có trong công việc hàng ngày. Hi vọng mọi người có thể áp dụng thành công để có thể kéo website leo top trên Google nhé.